限制容器显存的方法、装置、电子设备以及存储介质与流程

文档序号:37263531发布日期:2024-03-12 20:45阅读:10来源:国知局
限制容器显存的方法、装置、电子设备以及存储介质与流程

本申请涉及人工智能领域,更具体地,涉及一种限制容器显存的方法、装置、电子设备以及存储介质。


背景技术:

1、图像处理器(graphic processing unit,gpu)是一种专门在个人电脑、工作站、游戏机和一些移动设备上做图像和图形相关运算工作的微处理器。随着人工智能的应用场景越来愈广泛,gpu的使用越来越普遍,其计算效率和使用成本越来越受到关注。如何提高gpu利用率,一直是个难题。


技术实现思路

1、鉴于上述问题,本申请提出了一种限制容器显存的方法、装置、电子设备以及存储介质,可以通过虚拟化技术,创建多个虚拟的gpu卡对物理gpu整卡的显存进行灵活切分,以便多个容器复用同一张gpu卡的显存,提高了gpu的利用率。

2、第一方面,本申请实施例提供了一种限制容器显存的方法,所述方法包括:初始化物理gpu卡上的容器中的运算应用程序,打开挂载至所述容器的虚拟gpu卡;发送显存分配请求至挂载在所述容器的虚拟gpu卡,其中,所述显存分配请求中包括显存分配大小;若确定所述显存分配大小小于或等于所述虚拟gpu卡剩余的显存大小,则通过所述虚拟gpu卡将所述显存分配请求发送至所述物理gpu卡,以指示所述物理gpu卡基于所述显存分配请求进行显存分配。

3、第二方面,本申请实施例提供了一种限制容器显存的装置,所述装置包括:虚拟卡打开模块、请求发送模块以及显存分配模块。其中,虚拟卡打开模块,用于初始化物理gpu卡上的容器中的运算应用程序,打开挂载至所述容器的虚拟gpu卡;请求发送模块,用于发送显存分配请求至挂载在所述容器的虚拟gpu卡,其中,所述显存分配请求中包括显存分配大小;显存分配模块,用于若确定所述显存分配大小小于或等于所述虚拟gpu卡剩余的显存大小,则通过所述虚拟gpu卡将所述显存分配请求发送至所述物理gpu卡,以指示所述物理gpu卡基于所述显存分配请求进行显存分配。

4、第三方面,本申请实施例提供了一种电子设备,包括存储器和处理器,所述存储器耦接到所述处理器,所述存储器存储指令,当所述指令由所述处理器执行时所述处理器执行上述方法。

5、第四方面,本申请实施例提供了一种计算机可读取存储介质,所述计算机可读取存储介质中存储有程序代码,所述程序代码可被处理器调用执行上述方法。

6、本申请实施例提供的限制容器显存的方法、装置、电子设备以及存储介质,通过初始化物理gpu卡上的容器中的运算应用程序,打开挂载至容器的虚拟gpu卡;发送显存分配请求至挂载在容器的虚拟gpu卡,其中,显存分配请求中包括显存分配大小;若确定显存分配大小小于或等于虚拟gpu卡剩余的显存大小,则通过虚拟gpu卡将显存分配请求发送至物理gpu卡,以指示物理gpu卡基于显存分配请求进行显存分配。本申请通过虚拟化技术,创建多个虚拟的gpu卡对物理gpu整卡的显存进行灵活切分,以便多个容器复用同一张gpu卡的显存,提高了gpu的利用率。



技术特征:

1.一种限制容器显存的方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:

3.根据权利要求1所述的方法,其特征在于,所述方法还包括:

4.根据权利要求1所述的方法,其特征在于,所述方法还包括:

5.根据权利要求1-4任一项所述的方法,其特征在于,在所述初始化物理gpu卡上的容器中的运算应用程序,打开挂载至所述容器的虚拟gpu卡之前,所述方法还包括:

6.根据权利要求5所述的方法,其特征在于,所述加载gpu虚拟化的内核模块,包括:

7.根据权利要求5所述的方法,其特征在于,在所述记录虚拟化所述物理gpu卡的主设备号之前,所述方法还包括:

8.根据权利要求1-4任一项所述的方法,其特征在于,所述方法还包括:

9.一种限制容器显存的装置,其特征在于,所述装置包括:

10.一种电子设备,其特征在于,包括:

11.一种计算机可读取存储介质,其特征在于,所述计算机可读取存储介质中存储有程序代码,所述程序代码可被处理器调用执行如权利要求1-8任一项所述的方法。


技术总结
本申请公开了一种限制容器显存的方法、装置、电子设备以及存储介质,涉及人工智能领域。该方法包括:初始化物理GPU卡上的容器中的运算应用程序,打开挂载至容器的虚拟GPU卡;发送显存分配请求至挂载在容器的虚拟GPU卡,其中,显存分配请求中包括显存分配大小;若确定显存分配大小小于或等于虚拟GPU卡剩余的显存大小,则通过虚拟GPU卡将显存分配请求发送至物理GPU卡,以指示物理GPU卡基于显存分配请求进行显存分配。本申请通过虚拟化技术,创建多个虚拟的GPU卡对物理GPU整卡的显存进行灵活切分,以便多个容器复用同一张GPU卡的显存,提高了GPU的利用率。

技术研发人员:徐进,冯敦超,周伟
受保护的技术使用者:深圳市欢太科技有限公司
技术研发日:
技术公布日:2024/3/11
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1