本技术属于计算机设备,特别是涉及云计算资源管理,具体涉及一种基于非标准化的gpu物理设备的上云方法及装置。
背景技术:
1、由于多种原因,将现有设备更换为国产化设备的趋势愈演愈烈,特别是国产化服务器作为基础建设的主要设施是相关领域近年来的努力方向,然而现有技术中,gpu物理服务器上云方法未对此做出针对性改进,同时gpu物理服务器与传统服务器上云相比仍存在一些差异。因此提出一个合理的针对国产化gpu服务器上的定制化上云方案是必要的,这将使gpu物理设备融入云平台管控系统及访问云上其他云产品成为可能。
技术实现思路
1、本发明可用于云计算资源管理技术在金融方面应用的技术领域,也可用于除金融领域之外的任意领域。
2、本发明的一个目的在于提供一种基于非标准化的gpu物理设备的上云方法,该方法一方面通过构建国产gpu云服务,支持国产gpu计算资源的弹性伸缩。另一方面,该方法通过bmc采集国产gpu设备计算卡的品牌和数量,自动完成设备投放至对应的机型资源池,简化了日常运维,也规避了手工操作的风险。最后该方法支持根据不同品牌型号的gpu物理机设备,自动安装对应的驱动和工具套件,用户登录实例后,无需再进行基础环境的安装和调试,为用户提供“开箱即用”的国产gpu云服务。
3、本发明的另一个目的在于提供一种基于非标准化的gpu物理设备的上云装置。本发明的另一个目的在于提供一种电子设备,该电子设备包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现上述基于非标准化的gpu物理设备的上云方法的步骤。本发明的还一个目的在于提供一种可读介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述基于非标准化的gpu物理设备的上云方法的步骤。
4、为解决本技术背景技术中的技术问题,本发明提供以下技术方案:
5、第一方面,本发明提供一种基于非标准化的gpu物理设备的上云方法包括:
6、获取非标准化gpu物理机的带外信息,并将所述带外信息上传至云端平台;
7、根据所有非标准化gpu物理机所发送的vxlan报文生成虚拟化网络信息,其中,所有的非标准化gpu物理机所发送的vxlan报文通过一个虚拟网际协议地址传输至所述云端平台;
8、通过zk集群将所述虚拟化网络信息上传至所述云端平台。
9、在本发明的一实施例中,所述根据所有非标准化gpu物理机所发送的vxlan报文生成虚拟化网络信息,包括:
10、根据所述vxlan报文将所述非标准化gpu物理机所在的子网的网络协议进行转换,以生成第一网络协议;
11、根据第一网络协议将所述云端平台的网络协议转换为第二网络协议,其中所述第一网络协议与所述第二网络协议兼容。
12、在本发明的一实施例中,根据所述vxlan报文将所述非标准化gpu物理机所在的子网的网络协议进行转换,以生成第一网络协议,包括:
13、解析所述vxlan报文,以生成外层报文以及内层报文;
14、在所述外层报文中,将源ip设置为上联交换机的端点ip,以及将目的ip设置为网关的虚拟ip;
15、在所述内层报文中,将源ip设置为非标准化gpu物理机的虚拟化网络ip,以及将目的ip设置为欲访问的对端的目标ip。
16、在本发明的一实施例中,所述根据第一网络协议将所述云端平台的网络协议转换为第二网络协议,包括:
17、根据所述vxlan报文以及所述内层报文的目的地址和vni信息,查到对应的路由表,以确定所述第二网络协议的外层目的地址。
18、在本发明的一实施例中,所述获取非标准化gpu物理机的带外信息,包括:
19、通过远程连接将所有非标准化gpu物理机连接至云端平台;
20、通过所述远程连接的bmc端口获取所述非标准化gpu物理机的带外信息。
21、在本发明的一实施例中,基于非标准化的gpu物理设备的上云方法,还包括:
22、通过所述zk集群实时获取所有非标准化gpu物理机对应子网的路由信息;
23、根据所述路由信息更新所述虚拟化网络信息。
24、在本发明的一实施例中,基于非标准化的gpu物理设备的上云方法,还包括:
25、在所述非标准化gpu物理机所在的子网的上联交换机内建立独立隔离网络;
26、在所述独立隔离网络建立二层广播域网络;
27、在所述二层广播域网络建立三层逻辑接口;
28、根据所述独立隔离网络、所述二层广播域网络以及所述三层逻辑接口将所述非标准化gpu物理机在云下进行隔离。
29、第二方面,本发明提供一种基于非标准化的gpu物理设备的上云装置,该装置包括:
30、带外信息获取模块,用于获取非标准化gpu物理机的带外信息,并将所述带外信息上传至云端平台;
31、虚拟化网络信息生成模块,用于根据所有非标准化gpu物理机所发送的vxlan报文生成虚拟化网络信息,其中,所有的非标准化gpu物理机所发送的vxlan报文通过一个虚拟网际协议地址传输至所述云端平台;
32、信息上云模块,用于通过zk集群将所述虚拟化网络信息上传至所述云端平台。
33、在本发明的一实施例中,所述虚拟化网络信息生成模块包括:
34、第一网络协议生成单元,用于根据所述vxlan报文将所述非标准化gpu物理机所在的子网的网络协议进行转换,以生成第一网络协议;
35、第二网络协议生成单元,用于根据第一网络协议将所述云端平台的网络协议转换为第二网络协议,其中所述第一网络协议与所述第二网络协议兼容。
36、在本发明的一实施例中,所述第一网络协议生成单元包括:
37、vxlan报文解析单元,用于解析所述vxlan报文,以生成外层报文以及内层报文;
38、外层报文设置单元,用于在所述外层报文中,将源ip设置为上联交换机的端点ip,以及将目的ip设置为网关的虚拟ip;
39、内层报文设置单元,用于在所述内层报文中,将源ip设置为非标准化gpu物理机的虚拟化网络ip,以及将目的ip设置为欲访问的对端的目标ip。
40、在本发明的一实施例中,所述第二网络协议生成单元包括:
41、外层目的地址确定单元,用于根据所述vxlan报文以及所述内层报文的目的地址和vni信息,查到对应的路由表,以确定所述第二网络协议的外层目的地址。
42、在本发明的一实施例中,所述带外信息获取模块包括:
43、远程连接单元,用于通过远程连接将所有非标准化gpu物理机连接至云端平台;
44、带外信息获取单元,用于通过所述远程连接的bmc端口获取所述非标准化gpu物理机的带外信息。
45、在本发明的一实施例中,基于非标准化的gpu物理设备的上云装置,还包括:
46、路由信息获取模块,用于通过所述zk集群实时获取所有非标准化gpu物理机对应子网的路由信息;
47、虚拟化网络信息更新模块,用于根据所述路由信息更新所述虚拟化网络信息。
48、在本发明的一实施例中,基于非标准化的gpu物理设备的上云装置,还包括:
49、独立隔离网络建立模块,用于在所述非标准化gpu物理机所在的子网的上联交换机内建立独立隔离网络;
50、二层广播域网络建立模块,用于在所述独立隔离网络建立二层广播域网络;
51、三层逻辑接口建立模块,用于在所述二层广播域网络建立三层逻辑接口;
52、云下隔离模块,用于根据所述独立隔离网络、所述二层广播域网络以及所述三层逻辑接口将所述非标准化gpu物理机在云下进行隔离。
53、第三方面,本发明提供一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现一种基于非标准化的gpu物理设备的上云方法的步骤。
54、第四方面,本发明提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时实现基于非标准化的gpu物理设备的上云方法的步骤。
55、第五方面,本发明提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现基于非标准化的gpu物理设备的上云方法的步骤。
56、从上述描述可知,本发明实施例提供一种基于非标准化的gpu物理设备的上云方法及装置,对应的方法包括:首先获取非标准化gpu物理机的带外信息,并将带外信息上传至云端平台;接着,根据所有非标准化gpu物理机所发送的vxlan报文生成虚拟化网络信息,其中,所有的非标准化gpu物理机所发送的vxlan报文通过一个虚拟网际协议地址传输至云端平台;最后通过zk集群将虚拟化网络信息上传至云端平台。
57、对应的装置包括:带外信息获取模块,用于获取非标准化gpu物理机的带外信息,并将带外信息上传至云端平台;虚拟化网络信息生成模块,用于根据所有非标准化gpu物理机所发送的vxlan报文生成虚拟化网络信息,其中,所有的非标准化gpu物理机所发送的vxlan报文通过一个虚拟网际协议地址传输至云端平台;信息上云模块,用于通过zk集群将虚拟化网络信息上传至云端平台。
58、本发明为非标准化的gpu物理设备上云的必要环节提供了解决思路,具体地,首先通过云管控平台与bcm接口的通信,实现实例配置参数获取、机型自动化识别及创建、资源池数据整合等一系列上云流程,完成非标准化的gpu物理设备在云管控平台的自主投放。接着通过使用非标准化的gpu物理设备的专用网关及云管控平台,实现创建实例过程中的资源池设备获取、操作系统初始化、定制化驱动安装及网络切换,最终做到对非标准化的gpu物理设备在云管控平台上进行全生命周期管理。