用于所选择的虚拟机复制和虚拟机重新启动的方法和系统的制作方法_2

文档序号:8298904阅读:来源:国知局
时复本可以被关 闭以创建足够的用于重新启动的资源。
[0026] 另外,步骤310包括确定故障VM是否已被成功地重新启动。如果所有故障VM已被 重新启动并且所有服务路径已被所选择的重新启动算法恢复,则流程返回流程图的起点。 如果由于资源不充足而导致所有故障VM还没有被成功地重新启动,则在步骤312中,仍然 可以利用剩余资源执行复制。进一步地,本发明的至少一个实施例包括当资源可用并且充 足时,周期性地尝试重新启动故障VM。
[0027] 本发明的至少一个实施例包括使用与服务节点集合(即,共同提供服务的VM组) 相关联的值以控制VM资源分配决策。SNS值可以从商业值(包括用户输入)中导出,VM的 值可以由SNS的数量和值确定,其中这些SNS的VM是成员。
[0028] 因此,本发明的至少一个实施例包括优化用于所有提供的服务的SNS的总值,其 中,例如一个VM的故障可以使得多个SNS的值无效,并且约束包括管理程序的资源容量的 约束。另外,本发明的这种实施例包括将复制和重新启动操作合并到整体架构中以生成高 数值SNS和有故障倾向的VM的合并保护。
[0029] 本发明的至少一个实施例还包括处理容纳相互依赖的组件的VM的故障。因此,处 理服务请求的执行流程涉及一个或多个VM中的软件组件。VM故障导致在VM中的任何软 件组件发生故障,并且软件组件的故障中断任何包括该组件的请求处理执行流程。另外,值 (例如,商业值和/或SLA)被分配给不同的服务和/或不同类型的服务请求。为了确定VM 故障对不同服务和/或不同类型的服务请求的值有多大影响,本发明的至少一个实施例包 括处理服务类型级别值与执行流程级别故障之间的差距。
[0030] 如在此使用的,执行路径是指处理服务请求的软件组件的执行顺序。另外,执行路 径节点集合是指在执行路径中包含的VM的集合,而服务节点集合,如上文指出的,是指在 任何处理一种类型的服务请求的执行路径中包含的VM的集合。进一步地,不同的服务和不 同类型的服务请求可具有相同的SNS,VM可以在一个或多个SNS中。
[0031] 服务路径集合(SPS)是指处理一种类型的服务请求的所有执行路径的集合。另 外,SPS值测量由SPS提供的工作的重要性,其中该值与一种类型的服务请求相关联。
[0032] 存在与一种类型的服务请求相关联的SPS和SNS。当SNS中的每个VM对于SPS都 是同等重要时,SNS中的任何VM的故障导致SPS的零值,SNS中的所有VM的权重被设置为 相同,SNS中的所有VM被包含在SPS的每个元素(执行路径)中。本发明的至少一个实施 例包括将不同的重要性权重分配给SNS中的VM。另外,本发明的至少一个实施例包括从文 献(例如,某些故障模型对应于某些工作负载)和/或经验和/或历史数据中获得VM的故 障率。故障和/或误差模型(即,故障的类型)包括瞬时误差,其包括那些由安全性和/或 可靠性易损性导致的误差。
[0033] 另外,以下符号在此用于描述SR2引擎架构的目的:
[0034] -VM」是指VM,其中j= 1,2, ? ? ?n;
[0035] -氏是指管理程序,其中i= 1,2, ? ? ?m;
[0036] _SPSk是指服务路径集合,其中k= 1,2, ? ? ? 1;
[0037] -SNSk是指用于SPSk的服务节点集合;
[0038] _uk是指SPSk 的值;
[0039]_yk,」是指SNSk中VM」的权重,如果VM」不在SNSk中,则权重为0;
[0040]_r」是指正由VM」使用的资源;
[0041] -Ri是指Hi中的资源;
[0042] -当VMj(或其复本)在扎上时,Xi,j为1,否则为0。
[0043]-当VMj(或其复本)在任意管理程序上运行时,乂」为1,否则为0。
[0044] 仅仅对于所选择的复制,a代表复制因子,\代表VM」的故障率。
[0045] 如在此详细描述的,本发明的至少一个实施例包括执行所选择的复制以经由复制 保护VM以免发生故障,同时在资源容量的约束下最大化运行中的服务的总值。考虑以下的 例子(其中d= 2,仅作为示例):
[0046]-对于没有被复制的VMj:
【主权项】
1. 一种用于所选择的虚拟机复制和虚拟机重新启动的方法,包括: 在识别系统中包括多个虚拟机的集合中的一个或多个故障虚拟机之前,从所述包括多 个虚拟机的集合中选择将被复制的包括一个或多个虚拟机的子集,其中所述系统包括不足 以复制所述包括多个虚拟机的集合中的每个虚拟机的资源; 在识别所述包括多个虚拟机的集合中的一个或多个故障虚拟机之前,复制所述包括一 个或多个虚拟机的子集,其中所述复制包括减小由于一个或多个故障虚拟机而导致的预期 损失值; 在识别所述系统中所述包括多个虚拟机的集合中的所述一个或多个故障虚拟机后,选 择将被重新启动的包括所识别的一个或多个故障虚拟机的子集,其中所述系统包括不足以 重新启动所述包括多个虚拟机的集合中的每个故障虚拟机的资源;以及 在识别所述包括多个虚拟机的集合中的所述一个或多个故障虚拟机后,重新启动所述 包括所识别的一个或多个故障虚拟机的子集,其中所述重新启动包括减小由于一个或多个 故障虚拟机而导致的预期损失值; 其中所述选择步骤、所述复制步骤和所述重新启动步骤由计算设备执行。
2. 根据权利要求1所述的方法,其中,所述重新启动包括在至少一个约束内重新启动 所述包括所识别的一个或多个故障虚拟机的子集。
3. 根据权利要求2所述的方法,其中,所述至少一个约束包括计算能力。
4. 根据权利要求2所述的方法,其中,所述至少一个约束包括用于复制的网络带宽容 量。
5. 根据权利要求1所述的方法,包括: 在一个或多个虚拟机的所识别的故障之前,分配用于所述复制包括一个或多个虚拟机 的子集的预先确定量的资源。
6. 根据权利要求5所述的方法,包括: 将所述包括一个或多个虚拟机的子集复制到所述预先确定量的资源内。
7. 根据权利要求5所述的方法,其中,所述预先确定量的资源是能够配置的。
8. 根据权利要求1所述的方法,其中,所述选择包括识别一个或多个有故障倾向的虚 拟机。
9. 根据权利要求8所述的方法,包括: 基于企业优先级信息和/或多个虚拟机的故障行为,识别所述一个或多个有故障倾向 的虚拟机。
10. 根据权利要求1所述的方法,其中,所述一个或多个故障虚拟机的每一个是包括多 个虚拟机的组的成员,其中所述多个虚拟机的每一个有助于服务的提供。
11. 根据权利要求10所述的方法,其中,在所述包括多个虚拟机的组中的每个虚拟机 相对于所述组内对于所述服务的提供的优先级而被同等地加权。
12. 根据权利要求10所述的方法,其中,在所述包括多个虚拟机的组中的每个虚拟机 相对于所述组内对于所述服务的提供的优先级而被不同地加权。
13. -种用于所选择的虚拟机复制和虚拟机重新启动的系统,包括: 被配置为在识别系统中包括多个虚拟机的集合中的一个或多个故障虚拟机之前从所 述包括多个虚拟机的集合中选择将被复制的包括一个或多个虚拟机的子集的模块,其中所 述系统包括不足以复制所述包括多个虚拟机的集合中的每个虚拟机的资源; 被配置为在识别所述包括多个虚拟机的集合中的一个或多个故障虚拟机之前复制所 述包括一个或多个虚拟机的子集的模块,其中所述复制包括减小由于一个或多个故障虚拟 机而导致的预期损失值; 被配置为在识别所述系统中所述包括多个虚拟机的集合中的所述一个或多个故障虚 拟机后选择将被重新启动的包括所识别的一个或多个故障虚拟机的子集的模块,其中所述 系统包括不足以重新启动所述包括多个虚拟机的集合中的每个故障虚拟机的资源;以及 被配置为在识别所述包括多个虚拟机的集合中的所述一个或多个故障虚拟机后重新 启动所述包括所识别的一个或多个故障的虚拟机的子集的模块,其中所述重新启动包括减 小由于一个或多个故障的虚拟机而导致的预期损失值。
14. 根据权利要求13所述的系统,进一步包括: 被配置为在一个或多个虚拟机的所识别的故障之前分配用于所述复制包括一个或多 个虚拟机的子集的预先确定量的资源的模块。
15. 根据权利要求13所述的系统,进一步包括: 被配置为将所述包括一个或多个虚拟机的子集复制到所述预先确定量的资源内的模 块。
【专利摘要】在此提供了用于所选择的VM复制和VM重新启动技术的方法、系统和制造品。一种方法包括:在识别系统中包括多个VM的集合中的一个或多个故障VM之前,从包括多个VM的集合中选择将被复制的包括一个或多个VM的子集;在识别包括多个VM的集合中的一个或多个故障VM之前,复制包括一个或多个VM的子集;在识别系统中包括多个VM的集合中的一个或多个故障VM后,选择将被重新启动的包括所识别的一个或多个故障VM的子集;以及在识别包括多个VM的集合中的一个或多个故障VM后,重新启动包括所识别的一个或多个故障VM的子集。
【IPC分类】G06F9-455, G06F9-445
【公开号】CN104615476
【申请号】CN201410597262
【发明人】J·A·比文斯, A·博达斯, 邓豫, R·E·哈珀, R·马亨德鲁, H·V·拉马萨米, S·萨卡尔, 王龙
【申请人】国际商业机器公司
【公开日】2015年5月13日
【申请日】2014年10月30日
【公告号】US20150127970
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1