一种云计算系统可用性评估方法

文档序号:8459142阅读:421来源:国知局
一种云计算系统可用性评估方法
【技术领域】
[0001] 本发明涉及云计算技术领域,具体地说是一种实用性强、云计算系统可用性评估 方法。
【背景技术】
[0002] 云计算是一种新型的应用模式,云计算提供商管理大量计算,存储资源,通过虚拟 化等技术向用户提供计算,存储等资源。这些资源是按需分配,按量付费。云计算服务商承 诺提供的服务达到服务级别(Service Agreeement Layer)。云计算系统常见的服务承诺包 括性能,可用性。但是可用性缺乏定量评估手段,如每年平均故障时间小于10分钟等。历 史上Amazon等云计算公司的服务也曾意外停机,2012年亚马逊在北Virginia州的数据中 心因为飓风完全停止服务,影响搭建在其上的dropbox,netflix等公司的业务中断。
[0003] 云计算提供商声称其服务具有高可用性,但是用户无法对云计算系统的可用性进 行评估。云计算系统常常由成千上万个廉价服务器构成,其中软硬件故障频繁发生。传统 的集群系统可用性评估方法依次评估物理节点的故障率,然后根据各个节点在系统中所处 的位置建立可用性分析模型,最后计算得出系统整体的可用性。系统可用性和故障发生频 率,容错机制和故障恢复时间等因素相关。
[0004] 虚拟化技术为用户提供了统一的操作界面,屏蔽了低层的硬件差异和资源分布情 况。计算资源的使用者和拥有者分离,用户无法得知低层硬件的构成,故障率及恢复时间等 参数,因此无法使用传统的方法评估云计算系统的可用性。
[0005] 基于此,现提出一种通过测量虚拟机启动时间的云计算系统可用性评估方法。通 过使用该方法,最终用户可快速粗略评估云计算服务的可用性,用于选择云计算服务提供 商,以及评估将关键应用迀移至云平台的可行性。

【发明内容】

[0006] 本发明的技术任务是针对以上不足之处,提供一种实用性强、云计算系统可用性 评估方法。
[0007] -种云计算系统可用性评估方法,其具体实现过程为: 一、 首先评估云计算服务中虚拟机的启动时间; 二、 然后根据虚拟机启动时间粗略评估云计算服务的可用性:评估虚拟机的平均故障 时间,粗略评估单台虚拟机的可用性,即通过下述公式完成评估: 虚拟机的平均故障时间/(虚拟机的平均故障时间+虚拟机的启动时间); 三、 在服务商提供部分参数后精准评估云计算服务的可用性:评估出单台物理机平均 故障间隔时间、物理机集群平均故障间隔时间、虚拟机集群平均故障间隔时间及虚拟机的 可用性,其中虚拟机的可用性通过下述公式完成评估: 虚拟机集群平均故障间隔时间八虚拟机集群平均故障间隔时间+虚拟机的启动时间)。
[0008] 所述步骤一中的虚拟机的启动时间为虚拟机从申请资源到启动成功的时间,该申 请资源到启动成功的具体过程包括:申请资源并分配、BIOS启动、Boot Loader运行、载入 内核和初始化。
[0009] 所述步骤一中虚拟机的启动时间的具体评估过程为: 首先记录开始时间; 通过云计算平台提供的API申请虚拟机并通过API获取虚拟机的IP信息; 在获得IP ?目息后,使用75:计算API或ping命令获取虚拟机状态; 当ICMP协议有回应时,记录结束时间,两次记录的时间间隔即为虚拟机启动所需时 间。
[0010] 所述步骤二中云计算服务可用性粗略估计的具体过程为: 当云计算平台中平均每台物理机运行 t个虚拟机时,单台虚拟机的MTBF为物理机
【主权项】
1. 一种云计算系统可用性评估方法,其特征在于,其具体实现过程为: 一、 首先评估云计算服务中虚拟机的启动时间; 二、 然后根据虚拟机启动时间粗略评估云计算服务的可用性:评估虚拟机的平均故障 时间,粗略评估单台虚拟机的可用性,即通过下述公式完成评估: 虚拟机的平均故障时间/(虚拟机的平均故障时间+虚拟机的启动时间); 三、 在服务商提供部分参数后精准评估云计算服务的可用性:评估出单台物理机平均 故障间隔时间、物理机集群平均故障间隔时间、虚拟机集群平均故障间隔时间及虚拟机的 可用性,其中虚拟机的可用性通过下述公式完成评估: 虚拟机集群平均故障间隔时间八虚拟机集群平均故障间隔时间+虚拟机的启动时间)。
2. 根据权利要求1所述的一种云计算系统可用性评估方法,其特征在于,所述步骤一 中的虚拟机的启动时间为虚拟机从申请资源到启动成功的时间,该申请资源到启动成功的 具体过程包括:申请资源并分配、BIOS启动、BootLoader运行、载入内核和初始化。
3. 根据权利要求2所述的一种云计算系统可用性评估方法,其特征在于,所述步骤一 中虚拟机的启动时间的具体评估过程为: 首先记录开始时间; 通过云计算平台提供的API申请虚拟机并通过API获取虚拟机的IP信息; 在获得IP彳目息后,使用75:计算API或ping命令获取虚拟机状态; 当ICMP协议有回应时,记录结束时间,两次记录的时间间隔即为虚拟机启动所需时 间。
4. 根据权利要求1、2或3所述的一种云计算系统可用性评估方法,其特征在于,所述步 骤二中云计算服务可用性粗略估计的具体过程为: 当云计算平台中平均每台物理机运行A-个虚拟机时,单台虚拟机的MTBF为物理机 MTBF的^倍,即: k
其中为物理服务器的平均故障间隔时间,AOTF为虚拟机的平均故障间隔 时间,I:为单台物理机上平均启动的虚拟机数量; 则单台虚拟机的可用性计算如下:
5. 根据权利要求4所述的一种云计算系统可用性评估方法,其特征在于,所述步骤三 中云计算服务可用性精确估计过程为: 1)假设物理机平均故障间隔时间的数据采集矩阵为:
其中》表示云计算平台共有W个物理机;?表示采集数据时共有W个时间间隔, 即;rif表示物理机,在#/时间段共发生故障的次数; 2) 每台物理机上不同时间段启动虚拟机的个数矩阵i\T为:
?表示云计算平台共有《个物理机;《表示采集数据时共有m个时间间隔,即 尔; &表示物理机z.在时间段内启动的虚拟机数; 3) 则虚拟机的平均故障间隔时间KV为:
其中表示矩阵的点乘运算,同维矩阵点乘等于对应的元素相乘; 4) 定义平均故障间隔时间MHF为:
该公式中为失效时间,是指上一次设备恢复正常状态起,到设 备此次失效那一刻<Awpift:we之间间隔的时间; 5) 则单个物理机平均故障间隔时间:
Jt表示时间段编号,从1到HI;/表示物理机i在时间段^/发生故障次数编号,从 1到" ; €表示物理机;表示物理机2的平均故障间隔时间; 6) 物理机集群平均故障间隔时间:
z表示物理机编号;表示物理机集群的平均故障间隔时间; 7) 虚拟机集群平均故障间隔时间:
AflBg.表示虚拟机集群的平均故障间隔时间; 8) 由物理机集群平均故障间隔时间得
故可得
故虚拟机的可用性计算如下
【专利摘要】本发明公开了一种云计算系统可用性评估方法,其具体实现过程为:首先评估云计算服务中虚拟机的启动时间;然后根据虚拟机启动时间粗略评估云计算服务的可用性:评估虚拟机的平均故障时间,粗略评估单台虚拟机的可用性;在服务商提供部分参数后精准评估云计算服务的可用性:评估出单台物理机平均故障间隔时间、物理机集群平均故障间隔时间、虚拟机集群平均故障间隔时间及虚拟机的可用性。该一种云计算系统可用性评估方法与现有技术相比,可用于决策是否将重要应用迁移至云平台,以及评估基于云计算平台的各类应用可用性,实用性强。
【IPC分类】H04L12-26, H04L29-08
【公开号】CN104780075
【申请号】CN201510112060
【发明人】张晓 , 赵晓南, 李战怀, 李阿妮
【申请人】浪潮电子信息产业股份有限公司, 西北工业大学
【公开日】2015年7月15日
【申请日】2015年3月13日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1