面向高可靠性的云系统虚拟机任务备份装置、系统及方法

文档序号:7809800阅读:291来源:国知局
面向高可靠性的云系统虚拟机任务备份装置、系统及方法
【专利摘要】本发明公开了一种面向高可靠性的云系统虚拟机任务备份装置、系统及方法,属于云计算领域。本发明避免了过量点数据对决策的影响。采用趋势分析的方法,动态的决定下一次控制的时机,避免了“控制过密”和“控制过疏”的情况,同时动态的调整新增任务的数量。本发明动态的决定从高风险物理机向低风险物理机进行任务备份的策略,更好的同实时的系统可靠性波动相适应。
【专利说明】面向高可靠性的云系统虚拟机任务备份装置、系统及方法

【技术领域】
[0001] 本发明属于云计算领域,特别是涉及一种面向高可靠性的云系统虚拟机任务备份 装置、系统及方法。

【背景技术】
[0002] 云计算是指将计算分布在大量的分布式计算机上,使用云计算平台通过网络为用 户提供信息服务称为"云服务"。相对于传统的软件形态,云计算具有松散耦合、随需应变、 成本可控、资源虚拟、异构协同等显著的优势,使其更适应现金的电子商务、柔性制造、移动 互联网等应用。云计算包含两个方面的含义:一个方面是底层构建的云计算平台基础设施, 是用来构建上层应用程序的基础;另一方面的含义是构建在这个基础平台之上的云计算应 用程序。云计算是通过系统虚拟化、多处理器虚拟化、内存虚拟化、I/O虚拟化等虚拟化技 术将物理资源虚拟化成资源池,这些资源再由云系统平台进行统一的管理调度。目前,有很 多企业和科研机构推出了自己的云系统,面向用户提供计算资源和存储资源。最具有代表 性的是亚马逊(Amazon)的弹性计算云EC2 (Elastic Compute Cloud)。
[0003] 同其他软硬件系统一样,云系统中的主要计算单元,物理机(PM,Physical Machine),在运行时也会产生偶发错误和失效,从而导致任务逻辑和控制逻辑的混乱,进而 影响系统的可靠性。PM上运行的软件任务,主要以虚拟机(VM,Virtual Machine)的形式 存在。VM由云系统的任务管理器生成、分发、并部署于PM上。VM在PM上的执行,将占用该 PM的计算、存储、和1/0(输入输出)等资源,VM执行完成后,将释放所占用的资源。一个PM 能同时支撑和运行多个VM。
[0004] 为了减轻物理机失效所带来的负面影响,现今的云系统多采用VM进程备份的技 术,其基本思想为:在云系统运行时评估各个物理机的生存状况和失效可能性,将潜在失效 可能性较大的物理机上的VM进程,备份到其他失效可能性较低的物理机上,从而提高系统 整体的可靠性。
[0005] 然而,传统的面向高可靠性的VM进程备份方法,存在诸多的不足:
[0006] (1)进程备份的时机具有滞后性,往往等到物理机已经出现可靠性劣化时才开始 进行进程备份,甚至在备份未完成时就已经出现物理机失效。
[0007] (2)往往人为的预先指定进程备份的目的主机,而没有动态的考虑可嵌入主机的 实时可靠性变化,因而易出现目的物理机性能/可靠性劣化,而不再适合作为备份目标对 象的情况。
[0008] (3)没有考虑每个物理机失效间隔时间的概率分布,从而无法预定出哪个物理机 在未来一段时间内失效概率最大。


【发明内容】

[0009] 有鉴于现有技术的上述缺陷,本发明所要解决的技术问题是提供一种确保云系统 高可靠性的虚拟机任务备份方法。
[0010] 为实现上述目的,本发明提供了一种面向高可靠性的云系统虚拟机任务备份方 法,其特征在于包括以下步骤:
[0011] 步骤一、收集云系统中物理机的可靠性数据:
[0012] 设定云系统中有η个物理机,获取k次各物理机吣失效出现的时刻 SXi;1,SXi;2,…SXi;k ;n和k均为正整数,1彡i彡η ;
[0013] 步骤二、分析物理机的失效间隔时间分布函数:
[0014] Α1、设定计算各物理机Mi失效间隔时间序列{SXJGi;1,SXJGi;2, · · · SXJGi; ;
[0015] SXJGi;J = SX^-SX^^, 1 ^ j ^ k-1 ;
[0016] A2、设定所述失效间隔时间序列的平均失效率为XLSXQ ;计算

【权利要求】
1. 一种面向高可靠性的云系统虚拟机任务备份方法,其特征在于包括以下步骤: 步骤一、收集云系统中物理机的可靠性数据: 设定云系统中有η个物理机,获取k次各物理机Mi失效出现的时刻 SXi;1,SXi;2,…SXi;k ;n和k均为正整数,1彡i彡η ; 步骤二、分析物理机的失效间隔时间分布函数: Α1、设定计算各物理机吣失效间隔时间序列{SXJGi;1,SXJGi;2, · · · SXJGi;J};
SXJGi;J = SXi^-SX^^, 1 ^ j ^ k-1 ; A2、设定所述失效间隔时间序列的平均失效率为XLSXQ ;计算 得到失效间隔时间序列的平均失效率;
A3、确定失效间隔时间序列中的过量点,用标记变量GIA,j来表示SXJGu是否为过量 点; 0· 01 < YZ < 0· 1 ; 5 A4、设定物理机吣的多步对数失效间隔值增量为DXZLi,u,v,1彡u < v彡k-l ;
得到物理机%的多步 对数失效间隔值增量; A5、设宙各物理机的未夹预期失效率为RQL..:
得到各物理机的未来预 期失效率;所述Y为取值在〇至1之间的实数; 步骤三、计算物理机预期失效可能性: 设定各物理机在时间点T时的存活时间为(? :计算(? = T-SXi;k得到各物理机的存 活时间; 设定各物理机的将来失效可能性值为WLSXi ;计算= 1 得到各物理机 的将来失效可能性值; 步骤四、确定任务备份的源和目的主机: 设定GFX为高风险阈值,DFX为低风险阈值,0. 9 < GFX < 1,0 < DFX < 0. 1 ; 设定高于高风险阈值的主机数量为QC,低于低风险阈值的主机数量为QR,计算QC = num{i |WLSXi > GFX, 1 彡 i 彡 η}和 QR = num{i |WLSXi < DFX, 1 彡 i 彡 η}分别得到高于高 风险阈值的物理机数量和低于低风险阈值的物理机数量; 设定ZGFX为物理机中最高失效风险值,ZDFX为物理机中最低失效风险值;计算ZGFX =max {WLSXi 11彡i彡η}和ZDFX = min {WLSXi 11彡i彡η}分别得到物理机中最高失效风 获取最尚风险的物理机; 险值和物理机中最低失效风险值; 设定Mg为最尚风险的物理机,Md为最低风险的物理机;
, 获取最低风险的物理机; , 步骤五、判断是否g和d都不为0 ; 当g和d都不为0时,执行步骤六;否则返回执行步骤一; 步骤六、获取物理机Md上剩余可支持的虚拟机任务数量的最大值,SYZD ; 获取物理机Mg上运行的虚拟机任务数量,YXSL ; 设定QYSL为实际可备份虚拟机数量,计算QYSL = min {SYZD,YXSL}得到实际可备份虚 拟机的数量; 步骤七、将物理机Mg上的QYSL个虚拟机任务,备份到物理机Md上。
2. 如权利要求1所述的面向高可靠性的云系统虚拟机任务备份方法,其特征是:所 述步骤七完成后,等待设定时间KZDD后返回执行步骤一,直到云系统停止运行;20毫秒 彡KZDD彡1000毫秒。
3. 如权利要求2所述的面向高可靠性的云系统虚拟机任务备份方法,其特征是:计算
得到等待设定时间KZDD ;所述A和B 均为正整数,MRDD为预先设定的默认等待时间,100毫秒<MRDD〈1000毫秒。
4. 一种面向高可靠性的云系统虚拟机任务备份装置,其特征在于:包括可靠性监测模 块(3)、控制决策模块(4)和备份控制模块(5);所述可靠性监测模块(3)由物理机可靠性 数据监测单元(301)和失效间隔时间分析单元(302)组成;所述控制决策模块(4)由物 理机预期失效可能性计算单元(401)和备份策略决定单元(402)组成;所述物理机可靠 性数据监测单元(301)的输出端连接所述失效间隔时间分析单元(302)的输入端,所述失 效间隔时间分析单元(302)的输出端连接所述物理机预期失效可能性计算单元(401)的 输入端,所述物理机预期失效可能性计算单元(401)的输出端连接所述备份策略决定单元 (402)的输入端,所述备份策略决定单元(402)的输出端连接所述备份控制模块(5)的输入 端; 所述物理机可靠性数据监测单元(301)收集云系统中物理机的可靠性数据: 设定云系统中有η个物理机,获取k次各物理机乂失效出现的时刻 SXi;1,SXi;2,…SXi;k ;n和k均为正整数,1彡i彡η ; 所述失效间隔时间分析单元(302)用于分析物理机的失效间隔时间分布函数: Α1、设定计算各物理机吣失效间隔时间序列{SXJGi;1,SXJGi;2, · · · SXJGi;J}; SXJGi;J = SXi^-SX^^, 1 ^ j ^ k-1 ;
A2、设定所述失效间隔时间序列的平均失效率为XLSXQ ;计 得到失效间隔时间序列的平均失效率; A3、确定失效间隔时间序列中的过量点,用标记变量GIA,j来表示SXJGu是否为过量 点;
0· 01 < YZ < 0· 1 ; A4、设定物理机吣的多步对数失效间隔值增量为DXZLi.u.v,1彡u < v彡k-Ι ;
得到物理机%的多步 对数失效间隔值增量; A5、设定各物理机的未来预期失效率为RQQ :
得到各物理机的未来预 期失效率;所述Y为取值〇至1之间的实数; 所述物理机预期失效可能性计算单元(401)用于计算物理机预期失效可能性: 设定各物理机在时间点T时的存活时间为(? :计算(? = T-SXi;k得到各物理机的存 活时间; 设定各物理机的将来失效可能性值为WLSXi ;计算灰LSX,. 得到各物理机 的将来失效可能性值; 所述备份策略决定单元(402)用于确定任务备份的源和目的主机: 设定GFX为高风险阈值,DFX为低风险阈值,0. 9 < GFX < 1,0 < DFX < 0. 1 ; 设定高于高风险阈值的主机数量为QC,低于低风险阈值的主机数量为QR,计算QC = num{i |WLSXi > GFX, 1 彡 i 彡 η}和 QR = num{i |WLSXi < DFX, 1 彡 i 彡 η}分别得到高于高 风险阈值的物理机数量和低于低风险阈值的物理机数量; 设定ZGFX为物理机中最高失效风险值,ZDFX为物理机中最低失效风险值;计算ZGFX =max {WLSXi 11彡i彡η}和ZDFX = min {WLSXi 11彡i彡η}分别得到物理机中最高失效风 险值和物理机中最低失效风险值; 设定Mg为最商风险的物理机,Md为最低风险的物理机;
获取最1?风险的物理机; ?
获取最低风险的物理机; 所述备份控制模块(5)用于将高风险物理机上的虚拟机任务备份到低风险物理机: 判断是否g和d都不为0 ;当g和d都不为0时,获取物理机Md上剩余可支持的虚拟机 任务数量的最大值,SYZD ;获取物理机Mg上运行的虚拟机任务数量,YXSL ; 设定QYSL为实际可备份虚拟机数量,计算QYSL = min {SYZD,YXSL}得到实际可备份虚 拟机的数量; 将物理机Mg上的QYSL个虚拟机任务,备份到物理机Md上。
5. 如权利要求4所述的面向高可靠性的云系统虚拟机任务备份装置,其特征是:所述 备份控制模块(5)等待设定时间KZDD后,重新收集云系统中物理机的可靠性数据,直到云 系统停止运行;20毫秒< KZDD < 1000毫秒。
6. 如权利要求5所述的面向高可靠性的云系统虚拟机任务备份装置,其特征是:所述 备份控制模块(5)通过计算
得到等待设定时间KZDD ;所述 A和B均为正整数,MRDD为预先设定的默认等待时间,100毫秒<MRDD〈1000毫秒。
7. -种面向高可靠性的云系统虚拟机任务备份系统,包括云系统的服务器(1),其特 征在于:所述服务器(1)内设置有云系统虚拟机任务备份装置(2),所述云系统虚拟机任务 备份装置(2)包括可靠性监测模块(3)、控制决策模块(4)和备份控制模块(5);所述可靠 性监测模块(3)由物理机可靠性数据监测单元(301)和失效间隔时间分析单元(302)组 成;所述控制决策模块(4)由物理机预期失效可能性计算单元(401)和备份策略决定单元 (402)组成;所述物理机可靠性数据监测单元(301)的输出端连接所述失效间隔时间分析 单元(302)的输入端,所述失效间隔时间分析单元(302)的输出端连接所述物理机预期失 效可能性计算单元(401)的输入端,所述物理机预期失效可能性计算单元(401)的输出端 连接所述备份策略决定单元(402)的输入端,所述备份策略决定单元(402)的输出端连接 所述备份控制模块(5)的输入端; 所述物理机可靠性数据监测单元(301)收集云系统中物理机的可靠性数据: 设定云系统中有η个物理机,获取k次各物理机乂失效出现的时刻 SXi;1,SXi;2,…SXi;k ;n和k均为正整数,1彡i彡η ; 所述失效间隔时间分析单元(302)用于分析物理机的失效间隔时间分布函数: Α1、设定计算各物理机吣失效间隔时间序列{SXJGi;1,SXJGi;2, · · · SXJGi;J};
SXJGi;J = SXi^-SX^^, 1 ^ j ^ k-1 ; A2、设定所述失效间隔时间序列的平均失效率为XLSXQ ;计算 得到失效间隔时间序列的平均失效率; A3、确定失效间隔时间序列中的过量点,用标记变量GIA,j来表示SXJGu是否为过量
0. 01 < YZ < 0. 1 ; A4、设定物理机吣的多步对数失效间隔值增量为DXZLi,u,v,1彡u < v彡k-Ι ;
得到物理机%的多步 对数失效间隔值增量; A5、设定各物理机的未来预期失效率为RQQ :
得到各物理机的未来预 期失效率;所述Y为取值〇至1之间的实数; 所述物理机预期失效可能性计算单元(401)用于计算物理机预期失效可能性: 设定各物理机在时间点T时的存活时间为(? :计算(? = T-SXi;k得到各物理机的存 活时间; 设定各物理机的将来失效可能性值为WLSXi ;计算灰1汉,.=得到各物理机 的将来失效可能性值; 所述备份策略决定单元(402)用于确定任务备份的源和目的主机: 设定GFX为高风险阈值,DFX为低风险阈值,0. 9 < GFX < 1,0 < DFX < 0. 1 ; 设定高于高风险阈值的主机数量为QC,低于低风险阈值的主机数量为QR,计算QC = num{i |WLSXi > GFX, 1 彡 i 彡 η}和 QR = num{i |WLSXi < DFX, 1 彡 i 彡 η}分别得到高于高 风险阈值的物理机数量和低于低风险阈值的物理机数量; 设定ZGFX为物理机中最高失效风险值,ZDFX为物理机中最低失效风险值;计算ZGFX =max {WLSXi 11彡i彡η}和ZDFX = min {WLSXi 11彡i彡η}分别得到物理机中最高失效风 险值和物理机中最低失效风险值; 设定Mg为最商风险的物理机,Md为最低风险的物理机;
获取最商风险的物理机; 获取最低风险的物理机; 所述备份控制模块(5)用于将高风险物理机上的虚拟机任务备份到低风险物理机: 判断是否g和d都不为0 ;当g和d都不为0时,获取物理机Md上剩余可支持的虚拟机 任务数量的最大值,SYZD ;获取物理机Mg上运行的虚拟机任务数量,YXSL ; 设定QYSL为实际可备份虚拟机数量,计算QYSL = min {SYZD,YXSL}得到实际可备份虚 拟机的数量; 将物理机Mg上的QYSL个虚拟机任务,备份到物理机Md上。
8. 如权利要求7所述的面向高可靠性的云系统虚拟机任务备份系统,其特征是:所述 备份控制模块(5)等待设定时间KZDD后,重新收集云系统中物理机的可靠性数据,直到云 系统停止运行;20毫秒< KZDD < 1000毫秒。
9. 如权利要求8所述的面向高可靠性的云系统虚拟机任务备份系统,其特征是:所述 备份控制模块(5)通过计算
辱到等待设定时间KZDD ;所述 A和B均为正整数,MRDD为预先设定的默认等待时间,100毫秒<MRDD〈1000毫秒。
【文档编号】H04L29/08GK104104730SQ201410359403
【公开日】2014年10月15日 申请日期:2014年7月25日 优先权日:2014年7月25日
【发明者】李佳, 夏云霓, 江涛 申请人:重庆广播电视大学, 夏云霓
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1