云主机集群自适应切分vGPU的方法、装置及设备与流程

文档序号:37000865发布日期:2024-02-09 12:44阅读:27来源:国知局
云主机集群自适应切分vGPU的方法、装置及设备与流程

本技术涉及虚拟机、云桌面管理平台、显卡虚拟化相关,具体涉及一种云主机集群自适应切分vgpu的方法、装置及设备。


背景技术:

1、显卡作为图形渲染、建模、大数据计算、ai(artificial intelligence,人工智能)计算等多个领域的计算力资源,在云平台上需要针对不同的业务场景为用户提供不同的配置选项。目前常见的显卡厂商的显卡产品一般提供以下功能:1、一块物理显卡设备(包括通过电路板、显卡外壳部件等物理方式把多个显卡封装成一个设备的)具有一个核心或多个核心;2、每个核心配备一定数量的显存;3、每个核心及其配备的显存,可以通过显卡厂商的工具包进行设置,可作为一个整体使用,也可以按照显卡厂商给出的配置(又称显卡配置)的选项,切分为多个虚拟显卡使用;4、每个核心无论是作为一个整体使用,还是切分后提供给多台云主机使用,可同时使用的云主机台数不能超出特定值,具体的,作为整体使用时,不能超过一台云主机,切分为多个虚拟显卡使用时,不能超过配置选项规定的数量;5、如需重新设置当前核心,需确保当前没有云主机正在使用当前核心。

2、在上述功能限制下,目前主流云平台使用显卡的方式一般包括以下两种:

3、(1)预先规划好常用业务需要的显卡配置,并按照规划对显卡核心进行设置。用户使用云主机时,直接开机即可获取到对应的显卡。如果需要使用不同配置时,由管理员安排特定时段,避免影响常用业务,重新设置显卡核心,提供给用户使用。此方式适用于大多数的小规模使用场景或计划性较强的教学场景,但需要提前做好规划,增加实施环节,并且遇到偶发的特殊需求时需要管理员人工干预;

4、(2)部署多个带显卡的计算节点,预估显卡配置的使用率,对不同计算节点的显卡核心进行不同的设置。用户使用某一款配置时,把云主机创建到对应的计算节点上。但此方式由于硬件成本较高,一般仅适用于大型云平台服务商。


技术实现思路

1、本技术提供一种云主机集群自适应切分vgpu的方法、装置及设备,能够解决小规模使用时需要过多人工干预的问题,同时不需要大型云平台服务商的高成本。

2、第一方面,本技术实施例提供一种云主机集群自适应切分vgpu的方法,所述云主机集群自适应切分vgpu的方法包括:

3、获取计算节点中每块显卡的每个核心所支持的配置,并在云主机创建时进行配置选择;

4、查询并判断云主机所在计算节点显卡的所有核心中是否存在与所选择配置一致的核心:

5、若是,则在所有一致核心中,选择一当前已使用云主机台数小于所选择配置规定数量的核心,分配给创建的云主机;

6、若否,则修改云主机所在计算节点显卡的空闲核心的配置,以与所选择配置一致,并将配置修改后的核心分配给创建的云主机。

7、结合第一方面,在一种实施方式中,所述获取计算节点中每块显卡的每个核心所支持的配置,具体为:

8、进行云平台系统的部署和启动,并查询得到已启用自适应切分显卡功能的计算节点;

9、获取查询得到的计算节点中每块显卡的每个核心所支持的配置。

10、结合第一方面,在一种实施方式中,在云主机创建时进行配置选择,具体为:

11、在计算节点进行云主机创建,并对创建的云主机进行硬件设置,判断云主机所在计算节点是否启用自适应切分显卡功能:

12、若否,则云主机在预先设定的配置中进行配置选择,并将选择的配置记录至数据库;

13、若是,则云主机在预先设定的配置中,以及获取的配置中进行配置选择,并将选择的配置记录至数据库。

14、结合第一方面,在一种实施方式中,在查询并判断云主机所在计算节点显卡的所有核心中是否存在与所选择配置一致的核心之前,还包括:

15、进行云主机开机时,判断云主机是否进行配置选择:

16、若是,则判断云主机所在的所在计算节点是否启用自适应切分显卡功能:

17、-若启用,则判断云主机所在的所在计算节点是否带有显卡,若未带有,则云主机进入常规开机流程,若带有,则查询并判断云主机所在计算节点显卡的所有核心中是否存在与所选择配置一致的核心;

18、-若未启用,则云主机进入常规开机流程;

19、若否,则云主机进入常规开机流程。

20、结合第一方面,在一种实施方式中,所述查询并判断云主机所在计算节点显卡的所有核心中是否存在与所选择配置一致的核心,具体为:

21、获取得到云主机所在计算节点显卡所有核心的配置;

22、将获取得到的配置依次与所选择的配置进行比对,进行是否一致判断。

23、结合第一方面,在一种实施方式中,所述在所有一致核心中,选择一当前已使用云主机台数小于所选择配置规定数量的核心,分配给创建的云主机,具体为:

24、获取云主机所在计算节点显卡的核心中,所有与所选择配置一致的核心;

25、判断获取的所有核心中是否存在满足判定条件的核心,所述判定条件为核心当前已使用云主机台数小于所选择配置规定的数量:

26、若存在,则在所有满足判定条件的核心中选择一核心分配给创建的云主机;

27、若不存在,判断云主机所在计算节点显卡当前是否存在空闲核心:

28、-若是,则修改一空闲核心的配置,以与所选择配置一致,并将配置修改后的核心分配给创建的云主机;

29、-若否,则获取云主机所在计算节点显卡的所有核心中,当前已使用云主机台数最少的核心,修改获取的核心的配置,以与所选择配置一致,并将配置修改后的核心分配给创建的云主机。

30、结合第一方面,在一种实施方式中,所述获取云主机所在计算节点显卡的所有核心中,当前已使用云主机台数最少的核心,修改获取的核心的配置,以与所选择配置一致,并将配置修改后的核心分配给创建的云主机,具体为:

31、获取云主机所在计算节点显卡的所有核心中,当前已使用云主机台数最少的核心;

32、判断获取的核心的配置是否与所选择配置相同:

33、若是,则将正在使用该核心的其中一云主机进行关机,然后查询当前正使用该核心的云主机数量,确定该核心至少已释放出一空闲数量后,将该核心分配给创建的云主机;

34、若否,则将正在使用该核心的所有云主机进行关机,然后查询当前正使用该核心的云主机数量,以确保使用该核心的所有云主机均已释放,然后修改该核心的配置,以与所选择配置一致,并将配置修改后的核心分配给创建的云主机。

35、结合第一方面,在一种实施方式中,修改云主机所在计算节点显卡的空闲核心的配置,以与所选择配置一致,并将配置修改后的核心分配给创建的云主机,具体为:

36、判断云主机所在计算节点显卡当前是否存在空闲核心:

37、-若是,则修改一空闲核心的配置,以与所选择配置一致,并将配置修改后的核心分配给创建的云主机;

38、-若否,则获取云主机所在计算节点显卡的所有核心中,当前已使用云主机台数最少的核心,将正在使用该核心的所有云主机进行关机,然后查询当前正使用该核心的云主机数量,以确保使用该核心的所有云主机均已释放,然后修改该核心的配置,以与所选择配置一致,并将配置修改后的核心分配给创建的云主机。

39、第二方面,本技术实施例提供一种云主机集群自适应切分vgpu的装置,所述云主机集群自适应切分vgpu的装置包括:

40、获取模块,其用于获取计算节点中每块显卡的每个核心所支持的配置,并在云主机创建时进行配置选择;

41、判断模块,其用于查询并判断云主机所在计算节点显卡的所有核心中是否存在与所选择配置一致的核心,若是,则驱使第一执行模块工作,若否,则驱使第二执行模块工作;

42、第一执行模块,其用于在所有一致核心中,选择一当前已使用云主机台数小于所选择配置规定数量的核心,分配给创建的云主机;

43、第二执行模块,其用于修改云主机所在计算节点显卡的空闲核心的配置,以与所选择配置一致,并将配置修改后的核心分配给创建的云主机。

44、第二方面,本技术实施例提供一种云主机集群自适应切分vgpu的设备,所述云主机集群自适应切分vgpu的设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的云主机集群自适应切分vgpu的程序,其中所述云主机集群自适应切分vgpu的程序被所述处理器执行时,实现上述所述的云主机集群自适应切分vgpu的方法的步骤。

45、本技术实施例提供的技术方案带来的有益效果包括:

46、通过在云主机创建时进行配置选择,然后查询并判断云主机所在计算节点显卡的所有核心中是否存在与所选择配置一致的核心,若存在,则在所有一致核心中,选择一当前已使用云主机台数小于所选择配置规定数量的核心,分配给创建的云主机,若不存在,则修改云主机所在计算节点显卡的空闲核心的配置,以与所选择配置一致,并将配置修改后的核心分配给创建的云主机,根据云主机的业务需求自适应切分显卡核心,用以解决小规模使用时需要过多人工干预的问题,同时不需要大型云平台服务商的高成本。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1