IaaS云系统中物理机的主动更新方法、装置及服务器的制造方法

文档序号:7783212阅读:195来源:国知局
IaaS云系统中物理机的主动更新方法、装置及服务器的制造方法
【专利摘要】本发明公开了一种IaaS云系统中物理机的主动更新方法、装置及服务器,其中的主动更新方法包括以下步骤:获取IaaS云系统中每台物理机的历史故障数据;逐台对获取的历史故障数据进行分析处理,获得每台物理机历史故障数据的分布规律,并基于所得分布规律预测相应物理机的下次故障数据;依据预测结果对相应物理机执行更新操作,本发明的IaaS云系统中物理机的主动更新方法通过对每台物理机的历史故障数据进行分析、建模,获得物理机故障的发生规律并依据所获得的规律对下次故障发生点进行预测,动态的调整物理机的更新时机,与现有技术中设定固定更新时间或仅依据历史故障数据平均值的方法相比,可以更好的兼顾更新系统开销和云系统可靠性。
【专利说明】IaaS云系统中物理机的主动更新方法、装置及服务器
【技术领域】
[0001]本发明属于云计算【技术领域】,涉及云计算运行中的资源实施调度和优化控制技术,具体涉及一种IaaS云系统中物理机(Physical Machine, PM)的主动更新方法、装置及服务器。
【背景技术】
[0002]云计算是指将计算分布在大量的分布式计算机上,使用云计算平台、通过网络为用户提供信息服务的计算模式。相对于传统的软件形态,云计算具有松散耦合、随需应变、成本可控、资源虚拟、异构协同等显著的优势,使其更适应现今的电子商务、柔性制造、移动互联网等应用。
[0003]云计算包含两个方面的含义:一个方面是底层构建的云计算平台基础设施,是用来构建上层应用程序的基础;另一方面的含义是构建在这个基础平台之上的云计算应用程序。
[0004]云计算按照服务类型可分为三类:将基础设施作为服务(Infrastructure asa Service, IaaS)、将平台作为服务(Platform as a Service, PaaS)和将软件作为服务(Software as a Service, SaaS)。IaaS模式云计算平台是通过系统虚拟化、多处理器虚拟化、内存虚拟化、I/O虚拟化等虚拟化技术将物理资源虚拟化成资源池,这些资源再由云计算平台进行统一的管理调度。目前,有很多企业和科研机构推出了 IaaS云计算平台,面向用户提供计算资源和存储资源。最具有代表性的是亚马逊(Amazon)的弹性计算云(Elastic Compute Cloud, EC2)。
[0005]同其他软硬件系统中的模块一样,IaaS云中的主要计算资源,物理机在运行时也受到硬件故障和软件故障的制约。当PM出现上述故障和故障时,其上运行的应用和程序(主要以虚拟机(Visual Machine, VM)实例的形式存在)也随之故障。当系统监测到故障后,开始对故障的PM和其上的VM进行修复,具体而言,先将故障的VM的最近存档点(checkpoint)映像(image)提取出来并转移到系统的后备存储或后备PM上,然后对PM进行恢复(硬重启或软重启),最后将提取出的VM映像重新加载到已恢复的PM上并执行启动。
[0006]上述这种事后修复的措施,存在一定的不足:从PM故障到故障被系统检测到还有一段时间的延迟,因此可能出现“系统向已经故障的PM继续派遣任务”的错误;故障时VM的状态与最近存档点的保存的VM映像所代表的状态有所区别,因此PM修复后实际上是将所涉及的VM还原到故障前某时刻而非故障时的状态,这实际上导致了无用功;故障后修复的系统开销较大,对IaaS云系统的性能的负面影响较大。为了避免上述问题,IaaS云系统多采用“故障后修复”与“主动更新(rejuevenation)”相结合的策略。主动更新是指,在PM还未出现故障时,就主动停止其运行并将其上的VM状态保存,待PM重启完成时,重新加载保存的VM状态并继续执行。相对于故障后修复,主动更新的优势在于:更新通常只是进行重启工作,故其系统开销远小于修复;由于更新重启后恢复的是更新前最后一刻的VM状态,因此VM执行进度不受影响,不存在无用功。
[0007]然而,如何确定PM主动更新的时机,却是一个技术难点。如果主动更新间隔时间过短,更新过于频繁,PM故障出现的可能性降低,然而更新带来的系统开销将抵消PM故障率降低产生的系统性能提升;如果更新间隔时间过大,更新过于稀疏,则PM故障先于更新出现的概率增大,系统不得不以事后修复作为主要的维护措施,带来可靠性和性能的损失,失去了主动更新的意义。
[0008]在此背景下,如何动态的根据IaaS云的运行时状态来尽心更新时机的决策,从而实现系统开销和性能的双赢,变成为了研究的热点和难点。
[0009]云计算本身属于一个新兴【技术领域】,相关的技术、理论和方法还处于成长期,现有的IaaS云系统的PM更新技术,存在诸多不足:
[0010](I)多采用固定周期PM更新的手段。现有的IaaS系统多预先设定一个固定的间隔时间进行周期性的更新。然而,由于系统负载、可靠性的动态可变性,固定间隔时间的更新往往难以兼顾更新操作开销少和系统可靠性高的要求;
[0011](2)缺乏量化趋势预测的机制。现有的IaaS云维护技术,没有充分的对系统历史故障数据进行分析和建模,而多是机械的采用历史平均或最近历史故障数据作为依据进行控制决策;
[0012](3)没有考虑不同PM的差别。现有的技术将IaaS云系统中的各个PM—视同仁,采取同样的控制策略和控制时间间隔,而没有考虑不同PM在负载、执行效率、可靠性上的差异。

【发明内容】

[0013]本发明的目的在于克服现有技术中的上述问题,提供一种能够兼顾更新开销、云系统可靠性和PM差异性的IaaS云系统中物理机的主动更新方法、装置及服务器。
[0014]为解决上述技术问题,本发明采用以下技术方案:
[0015]一种IaaS云系统中物理机的主动更新方法,包括以下步骤:
[0016]获取IaaS云系统中每台PM的历史故障数据;
[0017]逐台对获取的历史故障数据进行处理,获得每台PM历史故障数据的分布规律,并基于所得分布规律预测相应PM的下次故障数据;
[0018]依据预测结果对相应PM执行更新操作。
[0019]进一步的技术方案是,上述IaaS云系统中物理机的主动更新方法贯穿整个IaaS云系统运行过程。
[0020]进一步的技术方案是分别对获取的每台PM的历史故障数据进行平滑处理,并区分每台PM历史故障数据中的平滑点和非平滑点。
[0021]进一步地,上述的平滑处理可以采用最小二乘法、傅里叶变换或其他具有相同技术效果的方法。
[0022]进一步地,上述的平滑处理可以采用以下方法:
[0023]对于第j台PM的第i个历史故障数据gZy,
[0024]首先,计算该历史故障数据的曲度余弦值yxi;j:
【权利要求】
1.一种IaaS云系统中物理机的主动更新方法,其特征在于:包括以下步骤: 获取IaaS云系统中每台物理机的历史故障数据; 逐台对获取的历史故障数据进行处理,获得每台物理机历史故障数据的分布规律,并基于所得分布规律预测相应物理机的下次故障数据; 依据预测结果对相应物理机执行更新操作。
2.根据权利要求1所述的IaaS 云系统中物理机的主动更新方法,其特征在于:所述IaaS云系统中物理机的主动更新方法贯穿整个IaaS云系统运行过程。
3.根据权利要求1所述的IaaS云系统中物理机的主动更新方法,其特征在于:分别对获取的每台物理机的历史故障数据进行平滑处理,并区分每台物理机历史故障数据中的平滑点和非平滑点。
4.根据权利要求3所述的IaaS云系统中物理机的主动更新方法,其特征在于:所述平滑处理可以采用最小二乘法、傅里叶变换法或以下方法: 对于第j台物理机的第i个历史故障数据gzu, 首先,计算该历史故障数据的曲度余弦值yxu:.
5.根据权利要求3权利要求所述的IaaS云系统中物理机的主动更新方法,其特征在于:求历史故障数据中平滑点的平均斜率及非平滑点的平均影响力,由所得平滑点的平均斜率和非平滑点的平均影响力共同预测下一个故障数据。
6.根据权利要求5所述的IaaS云系统中物理机的主动更新方法,其特征在于:所述非平滑点的平均影响力YXL定义如下:

7.根据权利要求1~6任一项权利要求所述的IaaS云系统中物理机的主动更新方法,其特征在于:所述历史故障数据为历史故障间隔时间,所述历史故障间隔时间样本yb的获取包括以下步骤: 设定一个时间间隔jg ; 统计第i轮时间间隔jg内第j台物理机的故障次数CSu ; 第i轮时间间隔jg内第j台物理机的故障间隔时间yb。为:
8.—种基于权利要求1~7任一项权利要求所述的IaaS云系统中物理机的主动更新方法的IaaS云系统中物理机的主动更新装置,其特征在于:包括: IaaS云分析模块,用于获取IaaS云系统中各物理机的历史故障数据记录值,并为每个物理机决策是否进行更新操作; IaaS管理模块,用于接收决策信息,并为对应的PM执行更新操作。
9.根据权利要求8所述的IaaS云系统中物理机的主动更新装置,其特征在于:所述IaaS云分析模块包括: 数据获取单元,从IaaS云系统开始运行起,所述数据获取单元就持续不断的获取各物理机的历史故障数据; 数据处理单元,用于接收来自数据获取单元的历史故障数据,并对历史故障数据进行处理,; 预测单元,用于接收处理后的历史故障数据,分析历史故障的发生规律并基于所得发生规律预测下次故障的发生点; 决策控制单元,接收预测单元预测的下次故障发生点,并作出更新决策信息; 存储单元,用于存储关于IaaS云系统中物理机的主动更新方法的程序,该程序指令相关的单元完成相应的步骤;所述存储单元还用于存储每台PM的历史故障数据; 和/或所述IaaS管理模块包括物理机更新管理单元,所述物理机更新管理单元用于接收IaaS云分析模块决策控制单元发出的更新决策信息,并对相应的物理机执行更新。
10.一种IaaS云系统中物理机的主动更新服务器,其特征在于:包括权利要求8~9所述的IaaS云系统中物理机的主动更新装置。
【文档编号】H04L12/24GK103957229SQ201310750935
【公开日】2014年7月30日 申请日期:2013年12月31日 优先权日:2013年12月31日
【发明者】闫明明 申请人:电子科技大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1