云虚拟机迁移方法、装置和系统的制作方法

文档序号:7781682阅读:282来源:国知局
云虚拟机迁移方法、装置和系统的制作方法
【专利摘要】本发明公开了一种云虚拟机迁移方法,属于云计算领域,本发明旨在动态的跟踪云计算系统各个主机的运行时负载变化和其可靠性表现,然后自适应的决定控制的时机,并在主机间进行虚拟机进程的迁移,对系统负载和可靠性的变化做出及时的响应,从而改善系统的负载平衡度和提高任务可靠性。本发明充分考虑了云系统负载的动态波动性,通过跟踪其趋势预测系统未来的趋势变化,并提前进行VM迁移以改善负载平衡性,本发明将PM的失效可能性纳入负载平衡的考虑,使VM迁移策略能兼顾性能和任务可靠性,同时本发明根据系统状态动态的计算可变的控制间隔时间,避免了“控制过密”和“控制过疏”两个极端。
【专利说明】云虚拟机迁移方法、装置和系统
【技术领域】
[0001]本发明属于云计算领域,特别是涉及一种云虚拟机迁移方法、装置和系统。
【背景技术】
[0002]云计算是一种基于互联网的计算方式,通过这种方式,共享的软硬件资源和信息可以按需求提供给计算机和其他设备。云计算系统通过系统虚拟化、多处理器虚拟化、内存虚拟化、I / 0虚拟化等虚拟化技术将物理资源虚拟化成资源池,这些资源再由云计算平台进行统一的管理调度。
[0003]云系统中的主要计算单元一PM (Physical Machine,物理机),在运行时会产生偶发错误和失效,从而导致任务逻辑和控制逻辑的混乱,进而影响系统的可靠性。由于现今的云计算系统多运用于大规模科学计算、实时金融、在线交易、流媒体多播等高负载和高复杂度的应用,其可靠性问题相对于传统的分布式计算和服务计算更加突出。此外,由于云计算多构架于广域分布的Internet上,任务请求的时间和地域分布体现出不规律性和人为偶然性,云系统的实时负载因此也更具动态波动性。由于系统负载的波峰和波谷出现时机难以预测,而系统又时刻受到主机失效和故障的威胁,动态的对云系统进行兼顾负载均衡和可靠性的控制存在很大的难度。传统的技术往往很难在性能、负载平衡度、和可靠性间取得良好的平衡。
[0004]近年来的研究发现,云系统中的主机(也就是物理机PM)的可靠性表现与其运行的时长有关:PM从第一次启动或者最近一次被完整修复后,其运行的时间越长,则出现故障和失效的几率越高。这就是可靠性工程中的“衰老(Aging)”现象。从第一次启动或者最近一次被完整修复开始到故障出现的时间间隔,可近似认为服从指数分布。这个时间间隔越短,代表失效率(Failure Rate)越高,反之则越低。一旦PM出现失效,其上运行的VM (虚拟机)也同时失效,从而导致任务可靠性的下降。因此,应该尽可能在失效出现前,将高失效可能性的PM上的VM进程,迁移到其他低失效可能性的PM上。同时,VM迁移还需考虑PM的负载情况。高负载的PM,计算和存储资源处于紧缺状态,任务的执行效率收到严重影响。因此,将高负载PM上的VM进程,迁移到低负载主机上,能实现更好的负载平衡性和性能。为了兼顾可靠性和负载均衡性,VM迁移策略须综合考虑上述因素。
[0005]现有的VM迁移主要存在以下的不足:
[0006](1)多采用固定周期控制的手段。现有的方法多预先设定一个固定的间隔时间进行周期性的控制。然而,由于系统负载的动态可变性,固定间隔时间的控制策略往往难以及时的对短时间内的负载激增做出迅速响应。
[0007](2)未充分考虑云主机的失效特性。现有的技术在进行VM迁移时,主要目标还是进行性能优化和负载均衡,没有考虑PM主机失效特性对系统和任务可靠性的影响。
[0008](3)缺乏预测机制。现有的技术,总是等负载达到一个阈值或已经出现主机失效时,才采取VM迁移的措施,缺乏提前预测和与控制的手段和机制。
【发明内容】

[0009]有鉴于现有技术的上述缺陷,本发明所要解决的技术问题是提供一种更加可靠且负载均衡的云虚拟机迁移方法。
[0010]为实现上述目的,本发明提供了一种云虚拟机迁移方法,包括以下步骤:
[0011]步骤一、收集云系统中各PM状态信息:
[0012]所述PM状态信息包括:对于第i个PM,从最近一次系统恢复/重启之后累积的运行时间Ti ;对于第i个PM,上一次失效到最近一次失效之间的间隔时间Di ;对于第i个PM,最近k次测得的PM的任务负载率即运行的VM数量与最大允许VM数量的比值RM、Ri;2.......Ru,所述任务负载率测量的间隔时间为S,δ >0,1、k均为正整数;
[0013]步骤二、预测各PM的未来负载预测值和未来存活概率;
[0014]根据Ri;1、Ri;2>......Ri,k序列数据计算负载率样本量,设定负载率样本
量为SPq,计算
【权利要求】
1.一种云虚拟机迁移方法,其特征在于包括以下步骤:步骤一、收集云系统中各PM状态信息:所述PM状态信息包括:对于第i个PM,从最近一次系统恢复/重启之后累积的运行时间凡;对于第i个PM,上一次失效到最近一次失效之间的间隔时间Di ;对于第i个PM,最近k次测得的PM的任务负载率Ri;1、Ri;2.......Ru,所述任务负载率测量的间隔时间为S,δ >0,1、k均为正整数;步骤二、预测各PM的未来负载预测值和未来存活概率;根据Ri;1、Ri;2>......Ri;k序列数据计算负载率样本量,设定负载率样本量 为SPi, j,计算
2.如权利要求1所述的云虚拟机迁移方法,其特征是:所述在长度为WT的时间段内对云系统主机上的VM进程进行迁移控制按以下步骤进行:当YC和YR值中至少有一个为0时,则在长度为WT的时间段内,不做任何VM迁移操作;当YC和YR值都不为0时,则从第YC个主机上迁出一个VM并迁入第YR个主机;然后返回执行步骤一。
3.—种云虚拟机迁移装置,其特征在于:包括主机监测模块(1)、控制决策模块(2)和VM迁移实施模块(3);所述主机监测模块(1)的输出端连接所述控制决策模块(2)的输入端,所述控制决策模块(2)的输出端连接所述VM迁移实施模块(3)的输入端;所述主机监测模块(1)用于收集云系统中各PM状态信息;所述控制决策模块(2)用于预测各PM的未来负载预测值和未来存活概率,并计算控制决策参考值和控制等待时间;所述VM迁移实施模块(3)用于对云系统主机上的VM进程进行迁移控制。
4.如权利要求3所述的云虚拟机迁移装置,其特征在于:所述主机监测模块(1)收集云系统中各PM状态信息,所述PM状态信息包括:对于第i个PM,从最近一次系统恢复/重启之后累积的运行时间凡;对于第i个PM,上一次失效到最近一次失效之间的间隔时间Di ;对于第i个PM,最近k次测得的PM的任务负载率Ri;1、Ri;2.......Ru,所述任务负载率测量的间隔时间为S,δ>0,1、k均为正整数。
5.如权利要求3或4所述的云虚拟机迁移装置,其特征是:所述控制决策模块(2)包括预测单元(201)、控制量计算单元(202)和控制时机决策单元(203);所述主机监测模块(1)的输出端连接所述预测单元(201)的输入端,所述预测单元(201)的第一输出端连接所述控制量计算单元(202)的输入端,所述预测单元(201)的第二输出端连接所述控制时机决策单元(203)的输入端,所述控制量计算单元(202)的输出端连接所述VM迁移实施模块(3)的第一输入端,所述控制时机决策单元(203)的输出端连接所述VM迁移实施模块(3)的第二输入端;所述预测单元(201)用于预测各PM的未来负载预测值和未来存活概率;所述控制量计算单元(202)用于计算控制决策参考值;所述控制时机决策单元(203)用于计算控制等待时间;所述预测单元(201)根据RM、R,2.......Ru序列数据计算负载率样本量,设定负载率样本量为SPy,所述预测单元(201)计算
6.如权利要求5所述的云虚拟机迁移装置,其特征是:所述VM迁移实施模块(3)根据所述控制的等待时间WT、移出主机编号YC和移入主机编号YR,在长度为WT的时间段内对云系统主机上的VM进程进行迁移控制:当YC和YR值中至少有一个为0时,则在长度为WT的时间段内,不做任何VM迁移操作;当YC和YR值都不为0时,则从第YC个主机上迁出一个VM并迁入第YR个主机。
7.—种云虚拟机迁移系统,包括云系统主机(4);其特征在于:所述云系统主机(4)内设置有云虚拟机迁移装置(5);所述云虚拟机迁移装置(5)包括主机监测模块(1)、控制决策模块(2)和VM迁移实施模块(3);所述控制决策模块(2)包括预测单元(201)、控制量计算单元(202 )和控制时机决策单元(203 );所述主机监测模块(1)的输出端连接所述预测单元(201)的输入端,所述预测单元(201)的第一输出端连接所述控制量计算单元(202)的输入端,所述预测单元(201)的第二输出端连接所述控制时机决策单元(203)的输入端,所述控制量计算单元(202)的输出端连接所述VM迁移实施模块(3)的第一输入端,所述控制时机决策单元(203)的输出端连接所述VM迁移实施模块(3)的第二输入端;所述主机监测模块(1)用于收集云系统中各PM状态信息;所述预测单元(201)用于预测各PM的未来负载预测值和未来存活概率;所述控制量计算单元(202)用于计算控制决策参考值;所述控制时机决策单元(203)用于计算控制等待时间;所述VM迁移实施模块(3)用于对云系统主机上的VM进程进行迁移控制;所述主机监测模块(1)收集云系统中各PM状态信息,所述PM状态信息包括:对于第i个PM,从最近一次系统恢复/重启之后累积的运行时间?\ ;对于第i个PM,上一次失效到最近一次失效之间的间隔时间Di ;对于第i个PM,最近k次测得的PM的任务负载率Ri;1、Ri;2.......Ru,所述任务负载率测量的间隔时间为S,δ >0,1、k均为正整数;所述预测单元(201)根据RM、R,2.......Ru序列数据计算负载率样本量,设定负载率样本量为SPi,j,所述预测单元(201)计算
【文档编号】H04L12/26GK103685542SQ201310717195
【公开日】2014年3月26日 申请日期:2013年12月23日 优先权日:2013年12月23日
【发明者】李佳, 江涛, 周树语 申请人:重庆广播电视大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1