设备复位方法、装置、存储介质及电子设备与流程

文档序号:36474046发布日期:2023-12-22 00:48阅读:35来源:国知局
设备复位方法与流程

本技术涉及计算机,具体而言,涉及一种设备复位方法、装置、存储介质及电子设备。


背景技术:

1、随着高性能计算、人工智能和存储等应用场景复杂度的提高,为提高资源利用率,需要在传统服务器硬件架构的基础上重新设计服务器资源管理架构,此外,在服务器资源管理架构的使用过程中,服务器中的设备在较多场景下均需要进行复位。相关技术中通过关闭主电源对设备进行复位,需要消耗较长的时间且效率低。

2、因此,如何提高对设备进行复位的效率成为业界亟待解决的技术问题。


技术实现思路

1、本技术提供一种设备复位方法、装置、存储介质及电子设备,用以解决现有技术中如何提高对设备进行复位的效率的技术问题。

2、第一方面,本技术提供了一种设备复位方法,应用于服务器中任一资源池的基板管理控制器;所述服务器包括多个资源池,各个资源池中均包括复杂可编程逻辑器件和基板管理控制器,所述复杂可编程逻辑器件,用于将所述任一资源池的基板管理控制器发送的复位信号传输至各个资源池中的待复位设备;所述方法包括:

3、接收复位命令并对所述复位命令进行解析,得到所述复位命令对应的复位场景;

4、基于所述复位场景确定所述复位场景对应的复位方法;

5、执行所述复位方法,以确定目标复杂可编程逻辑器件和目标待复位设备,并将所述复位信号发送至所述目标复杂可编程逻辑器件,使所述目标待复位设备复位。

6、在一些实施例中,所述各个资源池包括计算资源池、交换资源池、存储资源池和异构加速资源池;所述计算资源池通过所述交换资源池与所述存储资源池和所述异构加速资源池进行连接;所述计算资源池包括主机,所述主机中包括至少一个第一设备;所述接收复位命令之前,还包括:

7、在所述服务器接通电源的情况下,将通电信号发送至各个资源池的基板管理控制器,并接收各个基板管理控制器发送的通电完成信号;

8、向与所述交换资源池相连的所述存储资源池、所述异构加速资源池和所述计算资源池发送复位信号;

9、基于所述复位信号将所述第一设备,以及所述存储资源池和所述异构加速资源池的第二设备进行复位;

10、将所述交换资源池中的交换设备与复位后的第一设备和第二设备建立连接。

11、在一些实施例中,所述将所述交换资源池中的交换设备与复位后的第一设备和第二设备建立连接之后,还包括:

12、获取所述交换资源池中各个交换设备与所述第一设备和所述第二设备之间的连接关系,以及获取所述主机与所述第二设备的对应关系;

13、控制所述主机进行开机,并基于所述对应关系将所述主机对应的第二设备进行复位;

14、将所述连接关系和所述对应关系存储在所述任一资源池的基板管理控制器中;

15、向第一基板管理控制器发送限制指令,所述限制指令用于限制所述第一基板管理控制器对所述第一基板管理控制器的资源池中的设备进行控制;

16、其中,所述第一基板管理控制器为除所述任一资源池外的资源池的基板管理控制器。

17、在一些实施例中,所述控制所述主机进行开机,并基于所述对应关系将所述主机对应的第二设备进行复位,包括:

18、基于开机信号对所述主机进行开机;

19、在监控到所述主机发送的复位信号的情况下,向所述交换资源池的复杂可编程逻辑器件发送所述复位信号;

20、基于所述复杂可编程逻辑器件将所述复位信号发送至所述主机对应的第二设备,控制所述主机对应的第二设备进行复位,并将所述主机与所述主机对应的第二设备建立连接。

21、在一些实施例中,在所述复位场景为任一主机重启,对所述任一主机对应的第二设备进行复位的情况下,所述执行所述复位方法,包括:

22、确定待重启主机,将所述待重启主机进行重启;

23、基于所述连接关系和所述对应关系,确定所述待重启主机对应的第二设备连接的交换设备的连接端口;

24、基于所述连接端口确定所述目标复杂可编程逻辑器件;

25、向所述目标复杂可编程逻辑器件发送所述复位信号,以使所述目标待复位设备复位,所述目标待复位设备为所述待重启主机对应的第二设备。

26、在一些实施例中,在所述复位场景为对所述主机对应的第二设备进行重新分配的情况下,所述执行所述复位方法,包括:

27、确定待分配设备,将所述待分配设备作为所述目标待复位设备;

28、向所述交换设备发送断开命令,基于所述断开命令将所述待分配设备与所述主机断开连接;

29、向所述目标复杂可编程逻辑器件发送所述复位信号,以使断开连接后的待分配设备复位;

30、将所述断开连接后的待分配设备与新的主机建立连接;

31、基于所述待分配设备和所述新的主机与所述交换设备的连接关系,以及所述待分配设备和所述新的主机的对应关系,对所述连接关系和所述对应关系进行更新。

32、在一些实施例中,在所述复位场景为在任一交换设备存在异常,对与所述任一交换设备连接的资源池中的设备进行复位的情况下,所述执行所述复位方法包括:

33、将所述任一交换设备连接的主机和第二设备,作为目标待复位设备;

34、将所述任一交换设备连接的主机进行重启;

35、向所述目标复杂可编程逻辑器件发送所述复位信号,以使所述目标待复位设备复位;

36、将所述目标待复位设备与所述交换资源池中的除所述任一交换设备外的其他交换设备进行连接;

37、基于连接结果对所述连接关系进行更新。

38、第二方面,本技术提供了一种设备复位装置,应用于服务器中任一资源池的基板管理控制器;所述服务器包括多个资源池,各个资源池中均包括复杂可编程逻辑器件和基板管理控制器,所述复杂可编程逻辑器件,用于将所述任一资源池的基板管理控制器发送的复位信号传输至各个资源池中的待复位设备;所述基板管理控制器包括:

39、接收模块,用于接收复位命令并对所述复位命令进行解析,得到所述复位命令对应的复位场景;

40、确定模块,用于基于所述复位场景确定所述复位场景对应的复位方法;

41、复位模块,用于执行所述复位方法,以确定目标复杂可编程逻辑器件和目标待复位设备,并将所述复位信号发送至所述目标复杂可编程逻辑器件,使所述目标待复位设备复位。

42、第三方面,本技术提供了一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述的方法。

43、第四方面,本技术提供了一种电子设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行所述程序时实现上述的方法。

44、本技术提供的设备复位方法、装置、存储介质及电子设备,通过复杂可编程逻辑器件在各个资源池中传输复位信号,使得任一资源池的基板管理控制器均可通过复杂可编程逻辑器件将复位信号传输至各个资源池中的待复位设备,通过任一资源池的基板管理控制器即可实现各个资源池的统一复位和管理,无需人工关闭电源进行复位;通过复位命令对应复位场景来确定该复位命令对应的复位场景,可以根据不同复位场景对应的复位方法快速实现资源池中目标待复位设备的复位,提高了复位效率。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1