一种算力资源分配方法及装置与流程

文档序号:25543423发布日期:2021-06-18 20:40阅读:来源:国知局

技术特征:

1.一种算力资源分配方法,其特征在于,包括:

接收带有用户类型标记的任务请求,所述任务请求包括任务类型、任务时长、算力资源需求量、任务优先级以及资源池选择、队列选择;

根据所述用户类型对任务请求进行初分配,满足第一条件则控制该任务请求进入下一步骤,否则控制该任务请求进入所选资源池内的所选队列;

根据所述用户类型以及其已用算力资源量计算其算力资源余量,若所述用户的算力资源余量满足该任务请求的所述算力资源需求量,则控制该任务请求进入所选资源池内的所选队列,否则,控制该任务请求进入所述用户的任务请求队列;

当监测到所述用户的算力资源余量满足该任务请求的所述算力资源需求量,从所述用户的任务请求队列调度所述任务请求进入所选资源池内的所选队列。

2.根据权利要求1所述的算力资源分配方法,其特征在于,当该任务请求位于所选资源池内的所选队列时,

按照该任务请求的所述算力资源需求量与所选资源池内空闲资源的匹配度确定算力资源,并调度给所述任务;或,

按照队列排序,根据用户分值以及该任务请求的所述算力资源需求量确定算力资源,并调度给所述任务。

3.根据权利要求2所述的算力资源分配方法,其特征在于,当调度给该任务的算力资源量小于其算力资源需求量时,按照预设时段,检测该任务的算力资源占用率,若所述算力资源占用率达到调度阈值,则再次根据用户分值以及该任务请求的所述算力资源需求量确定算力资源直至该任务累计调度的算力资源量等于算力资源需求量。

4.根据权利要求2所述的算力资源分配方法,其特征在于,所述用户分值根据本年度合作指数、前n年内付费年次数以及用户重点指数评估。

5.根据权利要求4所述的算力资源分配方法,其特征在于,所述用户分值f>20,则调度的算力资源最大值≤m,其中,

f=5a+2b+5c,m为gpu卡数,

a为本年度合作指数,已签合同且付款则指数为2,已签合同未付款则指数为1;b为前5年内付费年次数;c为用户重点指数,长期重点用户的指数为2,短期重点用户的指数为1。

6.一种算力资源分配装置,其特征在于,包括:

接收模块,用于接收带有用户类型标记的任务请求,所述任务请求包括任务类型、任务时长、算力资源需求量、任务优先级以及资源池选择、队列选择;

一级分配模块,用于根据所述用户类型对任务请求进行初分配,满足第一条件则控制该任务请求进入二级分配模块,否则控制该任务请求进入所选资源池内的所选队列;

二级分配模块,用于根据所述用户类型以及其已用算力资源量计算其算力资源余量,若所述用户的算力资源余量满足该任务请求的所述算力资源需求量,则控制该任务请求进入所选资源池内的所选队列,否则,控制该任务请求进入所述用户的任务请求队列;

监测模块,用于监测所述用户的算力资源余量,当监测到所述用户的算力资源余量满足该任务请求的所述算力资源需求量,从所述用户的任务请求队列调度所述任务请求进入所选资源池内的所选队列。

7.根据权利要求6所述的算力资源分配装置,其特征在于,还包括:

调度模块,用于当该任务请求位于所选资源池内的所选队列时,按照该任务请求的所述算力资源需求量与所选资源池内空闲资源的匹配度确定算力资源,并调度给所述任务;或,按照队列排序,根据用户分值以及该任务请求的所述算力资源需求量确定算力资源,并调度给所述任务。

8.根据权利要求7所述的算力资源分配装置,其特征在于,还包括:

持续调度模块,用于当调度给该任务的算力资源量小于其算力资源需求量时,按照预设时段,检测该任务的算力资源占用率,若所述算力资源占用率达到调度阈值,则再次根据用户分值以及该任务请求的所述算力资源需求量确定算力资源直至累计调度的算力资源量等于算力资源需求量。

9.一种计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1-5任一所述方法。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有执行权利要求1-5任一所述方法的计算机程序。


技术总结
本发明公开了一种算力资源分配方法,包括:接收带有用户类型标记的任务请求;根据用户类型对任务请求进行初分配;根据用户类型以及其已用算力资源量计算其算力资源余量,若用户的算力资源余量满足该任务请求的算力资源需求量,则控制该任务请求进入所选资源池内的所选队列,否则,控制该任务请求进入用户的任务请求队列;当监测到用户的算力资源余量满足该任务请求的算力资源需求量,从用户的任务请求队列调度任务请求进入所选资源池内的所选队列。本发明通过设置多种资源池以及队列,既可以对用户提供多种选择,又可以对用户的多种算力资源需求进行自动调度管理,进一步通过阈值设定实现多次调度,提高算力资源利用率,避免资源浪费。

技术研发人员:徐莹;戴坚君;郭培卿;张怡;周曦民
受保护的技术使用者:上海超级计算中心
技术研发日:2021.03.22
技术公布日:2021.06.18
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1