一种hpc集群作业调度方法及装置的制造方法_4

文档序号:8430594阅读:来源:国知局
于同一构思,具体内容可参见本发明方法实施例中的叙述,此处不再赘述。
[0097]需要说明的是,在本文中,诸如第一和第二之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个......”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同因素。
[0098]本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储在计算机可读取的存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质中。
[0099]最后需要说明的是:以上所述仅为本发明的较佳实施例,仅用于说明本发明的技术方案,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所做的任何修改、等同替换、改进等,均包含在本发明的保护范围内。
【主权项】
1.一种HPC集群作业调度方法,其特征在于,设定分组规则,设定分组排序规则,设定条件,所述设定条件包括:就当前HPC集群中剩余的资源,分组中包括至少一个作业能够被执行;还包括: 根据设定的所述分组规则,将HPC集群中所有作业分为多个分组,其中,每个分组中至少包括一个作业; 根据设定的所述分组排序规则,将多个分组进行排序; 根据排序后的多个分组,依次轮询每个分组,并从满足所述设定条件的分组中取出一个作业进行执行,其中,当前HPC集群中剩余的资源满足取出的该作业的执行,并在所有分组均被轮询之后,重复执行本步骤,直至所有分组均不满足所述设定条件; 在确定所有分组中包括满足所述设定条件的分组时,针对确定的该分组执行所述根据排序后的多个分组,依次轮询每个分组,并从满足所述设定条件的分组中取出一个作业进行执行,直至所有作业执行结束。
2.根据权利要求1所述的方法,其特征在于,所述轮询每个分组包括:针对每一个分组,执行如下操作:判断分组中是否包括至少一个作业在当前HPC集群中剩余资源的条件下能够被执行,若是,则确定该分组满足设定条件,并获取该分组中就当前HPC集群中剩余资源条件下能够被执行的作业的标识;若否,则确定该分组不满足设定条件; 进一步包括:根据所述获取该分组中就当前HPC集群中剩余资源条件下能够被执行的作业的标识,从满足所述设定条件的分组中取出一个作业进行执行。
3.根据权利要求1所述的方法,其特征在于, 在所述根据排序后的多个分组,依次轮询每个分组,并从满足所述设定条件的分组中取出一个作业进行执行之前进一步包括:设定分组内部作业排序规则,并根据设定的所述分组内部作业排序规则,将满足所述设定条件的分组中所包括的就当前HPC集群中剩余资源条件下能够被执行的作业进行排序; 所述从满足所述设定条件的分组中取出一个作业进行执行,包括:根据各分组中所述HPC集群中剩余资源条件下能够被执行的作业的排序结果,选择排序第一的作业进行执行。
4.根据权利要求3所述的方法,其特征在于,所述根据设定的所述分组内部作业排序规则,将满足所述设定条件的分组中所包括的就当前HPC集群中剩余资源条件下能够被执行的作业进行排序,包括:根据排队时间、资源需求和优先级中的一种或多种进行排序。
5.根据权利要求1至4中任一所述的方法,其特征在于,所述根据设定的所述分组规贝1J,将HPC集群中所有作业分为多个分组,包括:根据用户、用户组或队列将HPC集群中所有作业分为多个分组。
6.一种HPC集群作业调度装置,其特征在于,包括: 存储单元,用于存储分组规则、存储分组排序规则和存储设定条件; 判断单元,用于根据设定条件,判断分组属性; 分割单元,用于根据设定的所述分组规则,将HPC集群中所有作业分为多个分组,其中,每个分组中至少包括一个作业; 第一排序单元,用于根据设定的所述分组排序规则,将多个分组进行排序; 调度单元,用于根据排序后的多个分组,依次轮询每个分组,并从满足所述设定条件的分组中取出一个作业进行执行,其中,当前HPC集群中剩余的资源满足取出的该作业的执行,并在所有分组均被轮询之后,重复执行本步骤,直至所有分组均不满足所述设定条件; 所述调度单元,用于在确定所有分组中包括满足所述设定条件的分组时,针对确定的该分组执行所述根据排序后的多个分组,依次轮询每个分组,并从满足所述设定条件的分组中取出一个作业进行执行,直至所有作业执行结束。
7.根据权利要求6所述的装置,其特征在于, 所述判断单元,用于针对每一个分组,执行如下操作:判断分组中是否包括至少一个作业在当前HPC集群中剩余资源的条件下能够被执行,若是,则确定该分组满足设定条件,并获取该分组中就当前HPC集群中剩余资源条件下能够被执行的作业的标识;若否,则确定该分组不满足设定条件; 所述调度单元,用于根据所述获取该分组中就当前HPC集群中剩余资源条件下能够被执行的作业的标识,从满足所述设定条件的分组中取出一个作业进行执行。
8.根据权利要求6所述的装置,其特征在于, 所述存储单元,用于存储分组内部作业排序规则; 进一步包括:第二排序单元,用于根据设定的所述分组内部作业排序规则,将满足所述设定条件的分组中所包括的就当前HPC集群中剩余资源条件下能够被执行的作业进行排序; 所述调度单元,用于根据各分组中所述HPC集群中剩余资源条件下能够被执行的作业的排序结果,选择排序第一的作业进行执行。
9.根据权利要求8所述的装置,其特征在于,该装置包括: 所述存储单元,用于存储根据排队时间排序、根据资源需求排序和根据优先级排序中的一种或多种所述分组内部作业排序规则; 所述第二排序单元,用于根据所述分组内部作业排序规则中的一种或多种对每一个分组中所包括的就当前HPC集群中剩余资源条件下能够被执行的作业进行排序。
10.根据权利要求6至9任一所述的装置,其特征在于, 所述存储单元,用于存储根据用户分组、根据用户组分组或根据队列分组中的一种分组规则;所述分割单元,用于根据所述分组规则的一种,将HPC集群中所有作业分为多个分组。
【专利摘要】本发明提供一种HPC集群作业调度方法及装置,该方法包括:设定分组规则,设定分组排序规则,设定判断分组的条件;根据设定的所述分组规则,将HPC集群中所有作业分为多个分组;根据设定的所述分组排序规则,将多个分组进行排序;根据排序后的多个分组,依次轮询每个分组,并从满足所述设定条件的分组中取出一个作业进行执行,并在所有分组均被轮询之后,重复执行本步骤,直至所有分组均不满足所述设定条件,待HPC集群中剩余计算资源恢复至有分组满足设定条件时,根据分组排序,执行所述从满足所述设定条件的分组中取出一个作业进行执行,直至所有作业执行结束。本发明能够实现HPC集群计算资源的合理分配。
【IPC分类】G06F9-48
【公开号】CN104750556
【申请号】CN201510176544
【发明人】邸双朋
【申请人】浪潮电子信息产业股份有限公司
【公开日】2015年7月1日
【申请日】2015年4月14日
当前第4页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1