1.一种算力资源分配方法,其特征在于,包括:
接收带有用户类型标记的任务请求,所述任务请求包括任务类型、任务时长、算力资源需求量、任务优先级以及资源池选择、队列选择;
根据所述用户类型对任务请求进行初分配,满足第一条件则控制该任务请求进入下一步骤,否则控制该任务请求进入所选资源池内的所选队列;
根据所述用户类型以及其已用算力资源量计算其算力资源余量,若所述用户的算力资源余量满足该任务请求的所述算力资源需求量,则控制该任务请求进入所选资源池内的所选队列,否则,控制该任务请求进入所述用户的任务请求队列;
当监测到所述用户的算力资源余量满足该任务请求的所述算力资源需求量,从所述用户的任务请求队列调度所述任务请求进入所选资源池内的所选队列。
2.根据权利要求1所述的算力资源分配方法,其特征在于,当该任务请求位于所选资源池内的所选队列时,
按照该任务请求的所述算力资源需求量与所选资源池内空闲资源的匹配度确定算力资源,并调度给所述任务;或,
按照队列排序,根据用户分值以及该任务请求的所述算力资源需求量确定算力资源,并调度给所述任务。
3.根据权利要求2所述的算力资源分配方法,其特征在于,当调度给该任务的算力资源量小于其算力资源需求量时,按照预设时段,检测该任务的算力资源占用率,若所述算力资源占用率达到调度阈值,则再次根据用户分值以及该任务请求的所述算力资源需求量确定算力资源直至该任务累计调度的算力资源量等于算力资源需求量。
4.根据权利要求2所述的算力资源分配方法,其特征在于,所述用户分值根据本年度合作指数、前n年内付费年次数以及用户重点指数评估。
5.根据权利要求4所述的算力资源分配方法,其特征在于,所述用户分值f>20,则调度的算力资源最大值≤m,其中,
f=5a+2b+5c,m为gpu卡数,
a为本年度合作指数,已签合同且付款则指数为2,已签合同未付款则指数为1;b为前5年内付费年次数;c为用户重点指数,长期重点用户的指数为2,短期重点用户的指数为1。
6.一种算力资源分配装置,其特征在于,包括:
接收模块,用于接收带有用户类型标记的任务请求,所述任务请求包括任务类型、任务时长、算力资源需求量、任务优先级以及资源池选择、队列选择;
一级分配模块,用于根据所述用户类型对任务请求进行初分配,满足第一条件则控制该任务请求进入二级分配模块,否则控制该任务请求进入所选资源池内的所选队列;
二级分配模块,用于根据所述用户类型以及其已用算力资源量计算其算力资源余量,若所述用户的算力资源余量满足该任务请求的所述算力资源需求量,则控制该任务请求进入所选资源池内的所选队列,否则,控制该任务请求进入所述用户的任务请求队列;
监测模块,用于监测所述用户的算力资源余量,当监测到所述用户的算力资源余量满足该任务请求的所述算力资源需求量,从所述用户的任务请求队列调度所述任务请求进入所选资源池内的所选队列。
7.根据权利要求6所述的算力资源分配装置,其特征在于,还包括:
调度模块,用于当该任务请求位于所选资源池内的所选队列时,按照该任务请求的所述算力资源需求量与所选资源池内空闲资源的匹配度确定算力资源,并调度给所述任务;或,按照队列排序,根据用户分值以及该任务请求的所述算力资源需求量确定算力资源,并调度给所述任务。
8.根据权利要求7所述的算力资源分配装置,其特征在于,还包括:
持续调度模块,用于当调度给该任务的算力资源量小于其算力资源需求量时,按照预设时段,检测该任务的算力资源占用率,若所述算力资源占用率达到调度阈值,则再次根据用户分值以及该任务请求的所述算力资源需求量确定算力资源直至累计调度的算力资源量等于算力资源需求量。
9.一种计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1-5任一所述方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有执行权利要求1-5任一所述方法的计算机程序。