1.一种资源分配方法,其特征在于,包括:
当获取到需要调度gpu资源的任务请求时,获取可用的gpu节点以及每个可用的gpu节点中已使用的gpu卡的数量;所述任务请求中携带有完成所述任务请求所需的gpu资源数量;
基于所述可用的gpu节点、所述gpu卡的数量以及每个所述gpu卡对应的拓扑结构,确定每个可用的gpu节点中每个空闲的gpu卡对应的权重值;
基于所述所需的gpu资源数量以及每个空闲的gpu卡对应的权重值确定所述任务请求对应的分配结果;
基于所述分配结果为所述任务请求分配gpu卡。
2.如权利要求1所述的资源分配方法,其特征在于,所述当获取到需要调度gpu资源的任务请求时,获取可用的gpu节点以及每个可用的gpu节点中已使用的gpu卡的数量,包括:
获取处于登录状态的gpu节点,以及每个gpu节点中空闲的gpu卡数量;
基于每个gpu节点中空闲的gpu卡数量以及所述所需的gpu资源数量确定所述可用的gpu节点;
获取每个可用的gpu节点中已使用的gpu卡的数量。
3.如权利要求1所述的资源分配方法,其特征在于,所述基于所述所需的gpu资源数量以及每个空闲的gpu卡对应的权重值确定所述任务请求对应的分配结果,包括:
对所述权重值进行排序,得到排序结果;
基于所述排序结果以及所述所需的gpu资源数量确定所述分配结果;所述分配结果包括第一标识信息以及第二标识信息;其中,所述第一标识信息用于标识待分配给所述任务请求的目标gpu节点,所述第二标识信息用于标识待分配给所述任务请求的目标gpu卡。
4.如权利要求3所述的资源分配方法,其特征在于,所述基于所述分配结果为所述任务请求分配gpu卡,包括:
基于所述第一标识信息在所述可用的gpu节点中查找所述目标gpu节点;
基于所述第二标识信息在所述目标gpu节点中查找所述目标gpu卡,并将所述目标gpu卡分配给所述任务请求。
5.如权利要求3所述的资源分配方法,其特征在于,所述基于所述分配结果为所述任务请求分配gpu卡之后,所述资源分配方法还包括:
基于所述目标gpu节点更新所述可用的gpu节点;
基于所述目标gpu卡更新每个可用的gpu节点中已使用的gpu卡的数量。
6.如权利要求1至5任一项所述的资源分配方法,其特征在于,当基于所述所需的gpu资源数量以及每个空闲的gpu卡对应的权重值未确定所述任务请求对应的分配结果时,随机为所述任务请求分配gpu卡。
7.一种资源分配装置,其特征在于,包括:
获取单元,用于当获取到需要调度gpu资源的任务请求时,获取可用的gpu节点以及每个可用的gpu节点中已使用的gpu卡的数量;所述任务请求中携带有完成所述任务请求所需的gpu资源数量;
第一确定单元,用于基于所述可用的gpu节点、所述gpu卡的数量以及每个所述gpu卡对应的拓扑结构,确定每个可用的gpu节点中每个空闲的gpu卡对应的权重值;
第二确定单元,用于基于所述所需的gpu资源数量以及每个空闲的gpu卡对应的权重值确定所述任务请求对应的分配结果;
分配单元,用于基于所述分配结果为所述任务请求分配gpu卡。
8.如权利要求7所述的资源分配装置,其特征在于,所述获取单元具体用于:
获取处于登录状态的gpu节点,以及每个gpu节点中空闲的gpu卡数量;
基于每个gpu节点中空闲的gpu卡数量以及所述所需的gpu资源数量确定所述可用的gpu节点;
获取每个可用的gpu节点中已使用的gpu卡的数量。
9.一种资源分配设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6任一项所述的资源分配方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的资源分配方法。