一种图形处理器分布式虚拟化的实现方法及分布式系统与流程

文档序号:20599306发布日期:2020-05-01 21:29阅读:来源:国知局

技术特征:

1.一种图形处理器分布式虚拟化的实现方法,其特征在于,应用于分布式系统,所述分布式系统包括主物理机和从物理机,所述主物理机包括图形处理器gpu、主内存、主内存管理器以及与所述gpu直通的gpu域,所述从物理机包括从内存、从内存管理器以及客户虚拟机,所述主内存与所述从内存为分布式共享内存,所述方法包括:

所述从物理机的客户虚拟机将待处理数据发送至所述从物理机的从内存;

所述从物理机的从内存管理器从所述从内存中提取所述待处理数据,并根据预先配置的从内存与主内存的对应关系,将所述待处理数据写入所述从内存对应的主内存;

所述主内存管理器从所述主内存中提取所述待处理数据,并根据预先配置的主内存与gpu域的对应关系,将所述待处理数据发送至所述主内存对应的gpu域;

所述gpu域调用直通的gpu对所述待处理数据进行处理,得到数据处理结果。

2.根据权利要求1所述的方法,其特征在于,在所述gpu域调用直通的gpu对所述待处理数据进行处理,得到数据处理结果之后,所述方法还包括:

所述gpu域将所述数据处理结果发送至所述主内存;

所述主内存管理器从所述主内存中提取所述数据处理结果,并根据所述预先配置的从内存与主内存的对应关系,将所述数据处理结果写入所述主内存对应的从内存;

所述从内存所属从物理机的从内存管理器从所述从内存中提取所述数据处理结果,并根据预先配置的从内存与客户虚拟机的对应关系,将所述数据处理结果发送至所述从内存对应的客户虚拟机。

3.根据权利要求1所述的方法,其特征在于,所述从物理机的从内存管理器从所述从内存中提取所述待处理数据,并根据预先配置的从内存与主内存的对应关系,将所述待处理数据写入所述从内存对应的主内存,包括:

所述从物理机的从内存管理器从所述从内存提取所述待处理数据,并根据预先配置的从内存与主内存的对应关系,通过远程直接内存访问中单边访问的方式,将所述待处理数据写入所述从内存对应的主内存。

4.根据权利要求1所述的方法,其特征在于,所述主物理机还包括宿主机操作系统,所述方法还包括:

所述宿主机操作系统在获取到创建gpu的客户虚拟机或者客户虚拟机挂载gpu的请求时,根据所述请求,向所述客户虚拟机分配gpu;

所述宿主机操作系统获取所述客户虚拟机所属从物理机为所述客户虚拟机分配的从内存以及所述主物理机为已分配的gpu分配的主内存;

所述宿主机操作系统建立所述从内存与所述主内存的对应关系,并将所述对应关系发送至所述主内存管理器及所述从物理机的从内存管理器;

所述从内存管理器将所述从内存以外设组件互联标准pci设备的形式挂到所述客户虚拟机上。

5.根据权利要求4所述的方法,其特征在于,所述方法还包括:

所述宿主机操作系统在获取到删除gpu的客户虚拟机或者客户虚拟机卸载gpu的请求时,根据所述请求,删除所述客户虚拟机对应的从内存与主内存的对应关系,并向所述主内存管理器和所述客户虚拟机所属从物理机的从内存管理器发送删除指令;

所述主内存管理器和所述从内存管理器根据所述删除指令,删除所述对应关系。

6.一种分布式系统,其特征在于,所述系统包括:主物理机和从物理机;所述主物理机包括gpu、主内存、主内存管理器以及与所述gpu直通的gpu域,所述从物理机包括从内存、从内存管理器以及客户虚拟机,所述主内存与所述从内存为分布式共享内存;

所述从物理机的客户虚拟机,用于将待处理数据发送至所述从物理机的从内存;

所述从物理机的从内存管理器,用于从所述从内存中提取所述待处理数据,并根据预先配置的从内存与主内存的对应关系,将所述待处理数据写入所述从内存对应的主内存;

所述主内存管理器,用于从所述主内存中提取所述待处理数据,并根据预先配置的主内存与gpu域的对应关系,将所述待处理数据发送至所述主内存对应的gpu域;

所述gpu域,用于调用直通的gpu对所述待处理数据进行处理,得到数据处理结果。

7.根据权利要求6所述的系统,其特征在于,所述主物理机与所述从物理机配置有支持远程直接内存访问的无限带宽网卡或者具有允许通过以太网使用远程直接内存访问功能的网卡。

8.根据权利要求6所述的系统,其特征在于,

所述gpu域,还用于将所述数据处理结果发送至所述主内存;

所述主内存管理器,还用于从所述主内存中提取所述数据处理结果,并根据所述预先配置的从内存与主内存的对应关系,将所述数据处理结果写入所述主内存对应的从内存;

所述从内存所属从物理机的从内存管理器,还用于从所述从内存中提取所述数据处理结果,并根据预先配置的从内存与客户虚拟机的对应关系,将所述数据处理结果发送至所述从内存对应的客户虚拟机。

9.根据权利要求6所述的系统,其特征在于,所述从物理机的从内存管理器,具体用于:

从所述从内存提取所述待处理数据,并根据预先配置的从内存与主内存的对应关系,通过远程直接内存访问rdma单边访问的方式,将所述待处理数据写入所述从内存对应的主内存。

10.根据权利要求6所述的系统,其特征在于,所述主物理机还包括宿主机操作系统;

所述宿主机操作系统,用于在获取到创建gpu的客户虚拟机或者客户虚拟机挂载gpu的请求时,根据所述请求,向所述客户虚拟机分配gpu;获取所述客户虚拟机所属从物理机为所述客户虚拟机分配的从内存以及所述主物理机为已分配的gpu分配的主内存;建立所述从内存与所述主内存的对应关系,并将所述对应关系发送至所述主内存管理器及所述从物理机的从内存管理器;

所述从内存管理器,还用于将所述从内存以pci设备的形式挂到所述客户虚拟机上。

11.根据权利要求10所述的系统,其特征在于,所述宿主机操作系统,还用于在获取到删除gpu的客户虚拟机或者客户虚拟机卸载gpu的请求时,根据所述请求,删除所述客户虚拟机对应的从内存与主内存的对应关系,并向所述主内存管理器和所述客户虚拟机所属从物理机的从内存管理器发送删除指令;

所述主内存管理器和所述从内存管理器,还用于根据所述删除指令,删除所述对应关系。


技术总结
本发明实施例提供了一种图形处理器分布式虚拟化的实现方法及分布式系统,分布式系统包括主物理机和从物理机,主物理机包括GPU、主内存、主内存管理器以及与GPU直通的GPU域,从物理机包括从内存、从内存管理器以及客户虚拟机,主内存与从内存为分布式共享内存。客户虚拟机将待处理数据发送至本地的从内存;从内存管理器到从内存中提取待处理数据,并根据预先配置的从内存与主内存的对应关系,将待处理数据写入对应的主内存;主内存管理器从主内存中提取待处理数据,并根据预先配置的主内存与GPU域的对应关系,将待处理数据发送至对应的GPU域;GPU域调用直通的GPU对待处理数据进行处理,得到数据处理结果。通过本方案,实现了GPU分布式虚拟化。

技术研发人员:李学辉
受保护的技术使用者:杭州海康威视系统技术有限公司
技术研发日:2019.12.11
技术公布日:2020.05.01
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1