一种算力模块集群的网络地址配置系统及方法与流程

文档序号:35201579发布日期:2023-08-22 07:09阅读:29来源:国知局
一种算力模块集群的网络地址配置系统及方法与流程

本发明涉及网络地址配置,特别是一种算力模块集群的网络地址配置系统及方法。


背景技术:

1、算力模块,是指能够提供算力的硬件模块。多个算力模块可组合为算力模块集群,将算力模块集群部署在云端,可同时为多用户提供在线算力资源。

2、单个算力模块通常由核心运算芯片及各种外围电路构成,其中核心运算芯片可以是cpu、gpu、dsp、fpga、人工智能专用芯片等。算力模块通常运行操作系统,比如linux。算力模块亦可运行一些小型的实时操作系统,比如rt-thread、qnx、ucos等。

3、算力模块通常运行网络协议栈以访问以太网,网络地址则是以太网上的节点在网络中具有的逻辑地址,可对节点进行寻址。ip地址是在以太网上给主机编址的方式,为每个计算机分配一个逻辑地址,这样不但能够对计算机进行识别,还能进行信息共享。

4、算力模块通常是小型嵌入式计算模块,多个算力模块可集成到一个机箱内并使用一台服务器进行管理,构成算力模块集群,管理这些算力模块的服务器称之为管理服务器。

5、一个算力模块集群,通常包含了多个算力模块,当需要对算力模块的网络地址进行初始化或重新配置时,传统的方法有两种;第一种方法是使用远程登录该算力模块后,对该算力模块的网络地址配置文件进行更改。但该方法有一定局限性:比如算力模块处于关机状态或其不支持远程登录(有的算力模块运行的是一些轻量级的操作系统,没有远程登录功能)时都无法使用这种方式进行更改。此外,如果算力模块数量较多,如果采用手动对算力模块的网络地址进行配置,效率极低。

6、第二种方法是在算力模块内部运行一个服务程序,在算力模块的管理服务器上运行一个管理程序,管理程序通过网络发送命令给算力模块的服务程序,服务程序根据命令进行修改,这种方法的可靠性存在一定问题:比如算力模块内的服务程序被异常中止且无法自动重启时则无法进行配置;又比如算力模块的处于关机状态时也无法使用这种方法进行更改。另外,这种方法要求管理服务器和算力模块的网络处于同一个局域网内,有很大的局限性。


技术实现思路

1、鉴于此,本发明提供一种算力模块集群的网络地址配置系统及方法,以解决上述技术问题。

2、本发明公开了一种算力模块集群的网络地址配置系统,其包括:依次连接的管理服务器、控制模块和算力模块集群;所述算力模块集群包括n个算力模块;

3、所述管理服务器,用于根据用户对算力模块的网络地址配置需求,向控制模块下发控制命令,以实现将pwr[i]信号置为低电平或高电平,以便于第i个算力模块判断是否需要关闭其电源;以实现将ctl[i]信号置为低电平或高电平,以便于第i个算力模块判断是否需要连通不同的存储通路;以实现与usb[i]信号连通,以便于对第i个算力模块进行读写操作,完成对第i个算力模块的网络地址配置;其中,pwr[i]信号、ctl[i]信号、usb[i]信号分别为第i个控制信号,i的取值范围为1至n;n为大于1的正整数;

4、所述控制模块,用于根据接收到的控制命令产生三组控制信号,以输出至n个算力模块中;每组控制信号的数量为n,每组的n个控制信号与n个算力模块一一对应;三组控制信号分别记为pwr[1:n]信号、ctl[1:n]信号和usb[1:n]信号。

5、进一步地,所述管理服务器仅使用1个usb,用于产生一个usb信号;

6、所述控制模块包含usb_hub模块、以及分别与usb_hub模块连接的控制单元和选通器;

7、所述usb_hub模块,用于接收所述管理服务器发送的usb信号,并将该usb信号扩展为控制usb信号和数据usb信号,分别输入至控制单元和选通器;

8、所述控制单元,用于产生pwr[i]信号、ctl[i]信号和usb[i]信号;

9、所述选通器被控制单元控制,用于将usb[i]信号输出至第i个算力模块。

10、进一步地,每个所述算力模块由算力芯片、usb-存储装置读写设备、通路选择器、存储装置构成;

11、所述算力芯片,用于执行所需的计算任务;

12、所述存储装置,用于存储算力芯片运行时所需的系统镜像;所述系统镜像包括设备初始化程序、操作系统、网络地址配置文件;

13、所述usb-存储装置读写设备,用于对所述存储装置进行读写操作;

14、所述通路选择器,用于根据ctl[1:n]信号的使能与否,选通第三存储通路连接到第一存储通路或第二存储通路。

15、进一步地,所述第一存储通路设置在算力芯片和通路选择器之间;所述第二存储通路设置在usb-存储装置读写设备和通路选择器之间;所述第三存储通路设置在通路选择器和存储装置之间。

16、进一步地,每个所述算力模块的电源被pwr[1:n]信号中的一个信号控制,当pwr[1:n]信号中的一个信号为高电平时,与其对应的算力模块处于上电状态,同时开启该算力模块的电源;当pwr[1:n]信号中的一个信号为低电平时,与其对应的算力模块处于掉电状态,同时关闭该算力模块的电源;

17、每个所述算力模块中的通路选择器被ctl[1:n]信号中的一个信号控制,当ctl[1:n]信号中的一个信号为高电平时,第三存储通路和第二存储通路连接;当ctl[1:n]信号中的一个信号为低电平时,第三存储通路和第一存储通路连接;

18、当第三存储通路和第二存储通路连接时,管理服务器通过usb信号对存储装置进行读写;当第三存储通路和第一存储通路连接时,算力芯片用于加载存储装置内的系统镜像并正常启动。

19、本发明还公开了一种适用于上述所述的算力模块集群的网络地址配置系统的方法,所述方法包括:

20、步骤1:在第i个算力模块检测到pwr[i]信号为低电平时,关闭第i个算力模块的电源;

21、步骤2:在第i个算力模块检测到ctl[i]信号为高电平时,将第三存储通路和第二存储通路连接;

22、步骤3:在第i个算力模块检测到pwr[i]信号为高电平时,开启算力模块电源;

23、步骤4:管理服务器将用户输入的网络地址信息写入第i个算力模块中的存储装置,以对该存储装置进行读写操作,完成第i个算力模块的网络地址修改;

24、步骤5:在第i个算力模块检测到ctl[i]信号为低电平时,将第三存储通路和第一存储通路连接;

25、步骤6:在第i个算力模块检测到pwr[i]信号为高电平时,开启第i个算力模块的电源,此时第i个算力模块以修改后的网络地址启动运行;

26、步骤7:重复执行步骤1至步骤6,即可对用户所需的所有算力模块进行网络地址配置。

27、进一步地,所述步骤1之前,所述方法还包括:

28、用户确定需要修改的算力模块序号为i;并确定需要修改的网络地址信息;用户将需要修改的算力模块序号和需要修改的网络地址信息输入到管理服务器中之后,管理服务器发送控制命令到控制模块,将pwr[i]信号置为低电平。

29、进一步地,所述步骤1之后,所述步骤2之前,所述方法还包括:

30、管理服务器发送控制命令到控制模块,将ctl[x]信号置为高电平。

31、进一步地,所述步骤2之后,所述步骤3之前,所述方法还包括:

32、管理服务器发送控制命令到控制模块,将usb信号和usb[i]信号选通;

33、管理服务器发送控制命令到控制模块,将pwr[i]信号置为高电平。

34、进一步地,所述步骤4之后,所述步骤5之前,所述方法还包括:

35、管理服务器完成修改地址之后,将pwr[i]信号置为低电平;

36、在第i个算力模块检测到pwr[i]信号为低电平时,关闭第i个算力模块的电源;

37、管理服务器发送控制命令到控制模块,将ctl[i]信号置为低电平。

38、由于采用了上述技术方案,本发明具有如下的优点:管理服务器仅使用1个usb接口,可对多个算力模块的网络地址进行配置,提升了算力模块集群网络地址配置的效率,并且该方法具备极高的可靠性,在算力模块处于关机状态时仍可进行。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1