服务器远程调试系统、方法、装置、设备及存储介质与流程

文档序号:37151505发布日期:2024-02-26 17:06阅读:16来源:国知局
服务器远程调试系统、方法、装置、设备及存储介质与流程

本技术涉及服务器,尤其涉及一种服务器远程调试系统、方法、装置、设备及存储介质。


背景技术:

1、伴随着物联网、大数据、人工智能(artificial intelligence,ai)技术的发展,服务器发挥的作用越来越重要。服务器主板的主要芯片有基板管理控制器(baseboardmanagement controller,bmc)、英特尔公司的集成南桥(platform controller hub,pch)、复杂可编程逻辑器件(complex programmable logic device,cpld)等。cpld属于硬件编程,稳定性很高,但bmc和pch属于软件编程,相对来说更容易出现固件(firmware,fw)损坏,进程跑飞,进程挂死等问题,这也是在服务器后期的维护问题中,占有较大比例的情形。

2、bmc的固件包含静态区域与动态区域,静态区域正常情况下不会被修改,动态区域存储的是配置信息,可以被修改。cpld仅校验静态区域,不会进行动态区域的校验。但是当动态区域数据异常时,也会影响bmc的正常运行。

3、当前用户已经遇到bmc校验正常并开始运行,但是由于动态区域数据异常会导致bmc运行异常。由于bmc与rj45网口之间只有一条通路,在bmc运行异常时,bmc网口不通,无法登录bmc网络(web),也无法通过网际互连协议(internet protocol,ip)远程访问服务器的情况,此时需要升级bmc固件或者恢复bmc版本来解决问题。但升级bmc固件的前提是登录bmc web,主动进行bmc版本的恢复,前提是bmc的网口可以正常通信。因此当前问题出现了一个死锁,没有可用的远程维护手段,这就给运维带来了极大的麻烦,也给客户带来了极差的体验。


技术实现思路

1、本技术的目的是提供一种服务器远程调试系统、方法、装置、设备及存储介质,用于实现在bmc网口不通时远程控制bmc flash芯片的固件升级或恢复,从而提升服务器的可维护性,保证服务器的正常使用,改善客户体验的同时,降低维护成本。

2、第一方面,本技术提供一种服务器远程调试系统,包括基板管理控制器bmc、平台固件保护恢复pfr复杂可编程逻辑器件cpld、物理层phy芯片、网络变压器、rj45网口、基板管理控制器闪存bmc flash芯片以及远程调试设备;其中,所述bmc与所述pfr cpld之间和所述pfr cpld与所述phy芯片之间均通过缩减型千兆介质独立接口rgmii总线连接,所述phy芯片与所述网络变压器通过介质相关接口mdi总线连接,所述网络变压器与所述rj45网口通信连接;

3、所述pfr cpld用于在所述bmc与所述phy芯片之间通信异常的情况下,断开所述bmc与所述pfr cpld之间的rgmii总线连接,读取所述pfr cpld的用户闪存ufm中存储的所述bmc的最新ip地址,基于所述最新ip地址建立与所述rj45网口之间的通信连接,将所述通信异常的原因上传至所述远程调试设备,基于所述远程调试设备针对所述通信异常的原因下发的第一远程调制指令控制所述bmc flash芯片进行固件升级或恢复。

4、可选地,所述pfr cpld还用于在所述bmc启动正常的情况下,透传并监听所述bmc与所述phy芯片之间的rgmii总线上的rgmii信号,并将所述bmc的最新ip地址存储到所述ufm,基于所述rgmii信号确定所述bmc与所述phy芯片之间是否通信异常以及所述bmc与所述phy芯片之间通信异常时所述通信异常的原因。

5、可选地,所述pfr cpld还用于在所述bmc启动异常的情况下,断开所述bmc与所述pfr cpld之间的rgmii总线连接,读取所述pfr cpld的ufm中存储的所述bmc的最新ip地址,基于所述最新ip地址建立与所述rj45网口之间的通信连接,将所述bmc启动异常的信息上传至所述远程调试设备,基于所述远程调试设备针对所述bmc启动异常的信息下发的第二远程调制指令控制所述bmc flash芯片进行固件升级或恢复。

6、可选地,所述pfr cpld还用于接收所述bmc发送的校验值,基于所述校验值确定所述bmc是否启动正常。

7、第二方面,本技术还提供一种服务器远程调试方法,应用于pfr cpld,所述方法包括:

8、在bmc与phy芯片之间通信异常的情况下,断开所述bmc与所述pfr cpld之间的rgmii总线连接;

9、读取所述pfr cpld的ufm中存储的所述bmc的最新ip地址;

10、基于所述最新ip地址建立与rj45网口之间的通信连接;

11、将所述通信异常的原因上传至远程调试设备;

12、基于所述远程调试设备针对所述通信异常的原因下发的第一远程调制指令,控制bmc flash芯片进行固件升级或恢复。

13、可选地,还包括:

14、在所述bmc启动正常的情况下,透传并监听所述bmc与所述phy芯片之间的rgmii总线上的rgmii信号;

15、将所述bmc的最新ip地址存储到所述ufm;

16、基于所述rgmii信号,确定所述bmc与所述phy芯片之间是否通信异常,以及所述bmc与所述phy芯片之间通信异常时所述通信异常的原因。

17、可选地,还包括:

18、在所述bmc启动异常的情况下,断开所述bmc与所述pfr cpld之间的rgmii总线连接;

19、读取所述pfr cpld的ufm中存储的所述bmc的最新ip地址;

20、基于所述最新ip地址建立与所述rj45网口之间的通信连接;

21、将所述bmc启动异常的信息上传至所述远程调试设备;

22、基于所述远程调试设备针对所述bmc启动异常的信息下发的第二远程调制指令,控制所述bmc flash芯片进行固件升级或恢复。

23、可选地,还包括:

24、接收所述bmc发送的校验值;

25、基于所述校验值确定所述bmc是否启动正常。

26、第三方面,本技术还提供一种服务器远程调试装置,包括:

27、断开模块,用于在bmc与phy芯片之间通信异常的情况下,断开所述bmc与pfr cpld之间的rgmii总线连接;

28、读取模块,用于读取所述pfr cpld的ufm中存储的所述bmc的最新ip地址;

29、建立模块,用于基于所述最新ip地址建立与rj45网口之间的通信连接;

30、上传模块,用于将所述通信异常的原因上传至远程调试设备;

31、控制模块,用于基于所述远程调试设备针对所述通信异常的原因下发的第一远程调制指令,控制bmc flash芯片进行固件升级或恢复。

32、第四方面,本技术还提供一种pfr cpld,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述第二方面任一种所述的服务器远程调试方法的步骤。

33、第五方面,本技术还提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述第二方面任一种所述的服务器远程调试方法的步骤。

34、第六方面,本技术还提供一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现如上述第二方面任一种所述的服务器远程调试方法的步骤。

35、本技术提供的服务器远程调试系统、方法、装置、设备及存储介质,该系统包括:bmc、pfr cpld、phy芯片、网络变压器、rj45网口、bmc flash芯片以及远程调试设备;其中,bmc与pfr cpld之间和pfr cpld与phy芯片之间均通过rgmii总线连接,phy芯片与网络变压器通过mdi总线连接,网络变压器与rj45网口通信连接,可以打通pfr cpld与phy芯片之间的硬件通路,从而打通pfr cpld与rj45网口之间的硬件通路;pfr cpld用于在bmc与phy芯片之间通信异常的情况下,断开bmc与pfr cpld之间的rgmii总线连接,由于bmc与pfr cpld之间和pfr cpld与phy芯片之间均通过rgmii总线连接,在断开bmc与pfr cpld之间的rgmii总线连接之后,可以由pfr cpld接管rgmii通信;接着,读取pfr cpld的ufm中存储的bmc的最新ip地址,可以在pfr cpld接管rgmii通信时使用bmc的最新ip地址,从而实现最新ip地址从bmc到pfr cpld的无缝切换;然后,基于最新ip地址建立与rj45网口之间的通信连接,将通信异常的原因上传至远程调试设备,基于远程调试设备针对通信异常的原因下发的第一远程调制指令控制bmc flash芯片进行固件升级或恢复,可以实现在bmc网口不通时远程控制bmc flash芯片的固件升级或恢复,从而提升服务器的可维护性,保证服务器的正常使用,改善客户体验的同时,降低维护成本。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1