一种虚拟化云中容错任务调度方法_4

文档序号:9235345阅读:来源:国知局
合的过程。二者的比较可W检验虚拟机迁移整合收缩的有效性。
[0130] NVUFASA畑:与FASA畑的区别在于NVUFASA畑没有采用垂直扩展方式,从而对比检 验垂直扩展方式的有效性。
[013U NVDFASA畑:与FASA畑的区别在于NVDFASA畑没有采用垂直收缩方式。二者的比 较检验垂直收缩方式的有效性。
[0132] NBSFASA畑:与FASA畑的区别在于NBSFASA畑中没有采用任务后移策略,通过对比 NBSFASA畑与FASA畑检验任务后移策略的有效性。
[0133] eF畑是一种经典的依赖任务容错调度算法。eF畑采用AsEarlyAs化ssible策 略调度主副版本。然而,该算法不具备动态调整资源规模的能力。
[0134] 我们采用完成率、主机活动时间与任务时间与主机时间百分比来检验系统的性 能。其中,完成率佑uarantee Ratio, GR)表示能成功完成的依赖任务组占所有提交任务 组的百分比;主机活动时间化ost Active Time, HAT)表示所有活动主机的总开机时间,该 指标反映了系统的资源开销情况;任务时间与主机时间百分比(Ratio of Task time over 化sts time, RTH)表示所有任务的执行时间的总和与主机活动时间的比值,该指标反映了 系统的资源利用率。
[01巧]首先,我们进行基于随机合成依赖任务组值AG)的实验。为保证实验的可重复性, 我们采用仿真模拟的方式测试上述算法。在本文的模拟实验中,我们使用了一种在工业界、 学术界常用的云平台仿真工具CloudSim。云平台中各参数设置如下:
[0136] 每台主机的处理能力为1000、1500、2000或3000MIPS,并由1抓PS网络互连; 系统中共有四种类型的虚拟机,处理能力分别为250、500、700或1000MIPS ;开启一台主 机的时间为90s,创建一台虚拟机的时间为15s ;依赖任务组按平均到达时间为1/A的 泊松分布到达云系统,1/A在[1/\。,1/\。+2]之间均匀分布。依赖任务组的截止期设 定为4.二口, +axef",其中表示该依赖任务组可能的最短执行时间,a符合均匀 分布U(l. 5, 2. 5)。依赖任务组按下述步骤生产:首先确定依赖任务组中的任务数量NW及依赖关系的数量U,本文实验中假设U = 4N;依赖任务组内各个任务的大小在范围 [1X105, 2X105]MI内均匀分布;在依赖任务组内不产生环的前提下,随机选定各依赖关系 的前驱任务与后继任务,各依赖关系所表示的消息的容量大小在[10,l00]MB内均匀分布; 根据依赖任务组的截止期计算各任务的截止期。
[0137] 关于任务组数量对性能的影响方面,图6至图8示出的是FASA畑与6种基准算法 在随机合成依赖任务组上工作时的算法性能-依赖任务组数量柱形比较图。具体地,图6 是GR-count柱形图;图7是HAT-count柱形图;图8是RTH-count柱形图。
[0138] 从图6可W看出,无论任务组数量如何变化,除eFRD外所有算法均能保持一个较 为稳定的完成率。该是由于其他算法充分考虑了云环境下资源规模庞大的特征,可根据任 务组数量的变化动态地调整资源规模,而eFRD不具备该种在线调整资源规模的能力,资源 规模一定,因此在任务组数量增加时,eFRD的完成率下降。由于NOFASARD没有采用重叠技 术,副版本需要消耗更多的资源,所W任务完成率要低于FASARD。此外,我们还可W发现, NBSFASARD的任务完成率同样低于FASARD,该说明任务后移策略可W通过充分利用各个已 调度任务之间的空闲时间槽,插入新的任务,从而提高系统的可调度性。值得注意的是,图 6表明FASARD与NCFASARD具有相近的较高的任务完成率,对于FASARD该是由于该算法综 合采用了重叠、任务后移策略、资源弹性供给等多种策略,有效地提高了系统的可调度性; 而对于NCFASARD,则是由于消耗了更多的计算资源。
[0139] 图7则表明,相比除eF畑外的其他算法,FASA畑始终保持一个更低的HAT值,该 说明FASARD中采用的各项技术与策略能有效地提高系统的资源利用率。另外,由于没有采 用虚拟机整合收缩方法,NCFASARD算法会产生大量空闲资源,所W资源开销最大,特别是随 着任务组数量的增加,资源浪费的情况更加明显。此外,我们还可W发现NVUFASARD的资源 开销是除NCFASARD W往的第二高,该是由于该算法无法通过垂直扩展方式来容纳新的任 务,必须通过水平扩展方式开启更多的虚拟机,而导致主机活动时间明显上升。由于缺少任 务后移策略,一些任务无法插入到各个空闲的时间槽内,致使出现资源浪费,NBSFASARD的 HAT也较高。随着任务组数量的增加,eF畑的HAT值也出现了一些上升,然而eF畑不具备 资源动态调整能力,该种上升只是因为系统运行的时间更长。
[0140] 在图8中,FASA畑有最高的RTH值,即资源利用率最高。该再次说明FASA畑中融 合的多种技术与策略可W有效地提高系统的资源利用率。NCFASARD由于没有采用资源整 合收缩方法,造成了大量资源浪费,而导致RTH值偏低,该表明虚拟机整合收缩对提高资源 利用率有重要作用。随着任务组数量的增多,前六种算法均由于接收更多的任务而资源利 用率上升。然而,eFRD的RTH值随着任务组数量的增加,先上升后下降,当任务组数量从50 增加到100时,更多的任务组可W被系统接收,而由于主机数量固定,主机活动时间仅少量 增加,因此RTH值上升,而当任务组数量进一步增加时,由于可接收的任务组数基本保持不 变,而系统运行时间增加,导致RTH值下降。
[0141] 关于任务组到达率对性能的影响方面,图9至图11示出的是FASA畑与6种基 准算法在随机合成依赖任务组上工作时的算法性能-依赖任务组到达率柱形比较图。具 体地,图9是GR-intervalTime柱形图;图10是HAT-intervalTime柱形图;图11是 RTH-intervalTime柱形图。其中,参数1/A。从W2为步长,从0增加到10。
[0142] 图9显示前6种算法由于可W动态调整资源规模,因此任务完成率均高于eFRD。 随着1/A。的增加,前六种算法的完成率均略有增加,该是由于当到达间隔时间较短时,系 统负载较重,扩展资源需要主机开机时间、虚拟机创建时间等额外的调整时间,导致大量任 务无法在截止前完成而被拒绝。相对应的,当间隔时间边长时,系统有较为充裕的时间进行 资源扩展,更多的任务可W在截止期内成功完成。同时,FASARD与NCFASARD有更高的完成 率,原因与图6中的类似。从图9还可W看出,由于无法动态扩展资源规模,eFRD的任务完 成率较低。
[0143] 从图10我们可W发现,FASA畑始终在前六种算法中保持最低的HAT值,该又一次 说明FASARD中所用的各种技术与策略的有效性。当间隔时间变长是,NCFASARD与其他算法 之间在资源开销上的差别变得更加明显,该说明缺少虚拟机整合收缩方法会在间隔时间变 长时明显导致更多的资源开销。此外,当1/ A。为0时,NOFASARD的HAT值也较高,该是由 于当大量任务组几乎同时涌入系统时,缺乏重叠技术会导致副版本的资源开销显著增大, 系统必须通过开启更多的主机才能应对该种过载情况。同时,我们还可W发现,随着间隔时 间的增大,由于接收任务数量增多,系统运行时间更长,eFRD的HAT值也略有上升。
[0144] 图11显示,随着间隔时间的变化,FASA畑的RTH值始终保持最高,表明FASA畑在 不同的任务到达情况下,均能有效地提高系统的资源利用率。而NCFASARD与eFRD的RTH 值在4到10之间下降,该是由于NCFASARD没有采用整合收缩方式,eFRD无法动态调整资 源规模,因此在系统负载变轻时出现更多的资源浪费,导致资源利用率下降。
[0145] 关于任务组截止期对性能的影响方面,图12至图14示出的是FASA畑与6种基准 算法在随机合成依赖任务组上工作时的算法性能-依赖任务组截止期柱形比较图。具体 地,图12是GR-a柱形图;图13是HAT-a柱形图;图14是RTH-a柱形图。其中,确定截 止期的参数a W 0. 2为步长,从1. 5变化到2. 5。
[0146] 从图12可W看出,截止期对各算法的完成率均有显著的影响。当截止期非常紧张 时(如,a = 1. 5),由于系统无法在短时间内完成资源扩展,大多数任务组都被拒绝。然而, 当截止期变得宽松时,前6种算法几乎可W接收所有任务组。值得注意的是,当截止期非常 紧张时,NVUFASARD的完成率明显低于除eFRD W外的所有算法,该是由于垂直扩展方式可 W在短时间内完成计算资源的扩展,响应系统变化的能力更强,我们可W认为,缺乏垂直扩 展能力时,系统的可调度性将大大恶化,特别是在任务截止期非常紧张的情况下。此外,由 于无法动态调整资源规模,我们再一次发现eFRD的任务完成率最低。
[0147] 图13显示,随着a的增加,所有算法的HAT值都随之增加。该是由于当a增加 时,系统可W接纳更多的任务组,需要更多的主机时间来执行该些任务。值得注意的是, NCFASARD的HAT值的上升速度明显快于其他算啊,该表明当截止期变宽松时,NCFASARD由 于无法充分利用已有资源,必须消耗更多的计算资源。此外,NVDFASA畑的HAT值仅次于 NCFASARD,该是由于当截止期变宽松时,NVDFASARD缺少垂直收缩方式,无法及时缩小闲置 的资源,造成了一定的资源浪费。
[0148] FASA畑的优势在图14中再一次得到展现。当截止期非常紧张时(a = 1.5), NCFASARD与NVDFASARD同样具有较高的RTH值。该是由于在该种情况下,系统过载,很少会 收缩计算资源规模,因此缺少虚拟机整合收缩方法与垂直收缩方式并不会对系统的资源利 用率造成很大影响。然而,当截止期变得宽松时,NCFASARD与NVDFASARD的资源利用率明 显劣于其他算法。eFRD的RTH值在截止期非常紧张时同样比较高,该是由于系统中几乎所 有资源都被使用了,而当截止期变得宽松时,出现闲置的计算资源,RTH值下降。
[0149] 完成了基于随机合成依赖任务组值AG)的实验之后,我们进一步进行基于真实依 赖任务组的实验。为了检验本文所提出的算法在真实应用下的可行性,我们基于5种真实 应用:LIGO,Montage,切berShake,Epegenomics与SIPHT进一步开展实验。对于每种应用, 我们使用Wo
当前第4页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1