服务器内存故障检测方法、装置、电子设备及存储介质与流程

文档序号:35226132发布日期:2023-08-24 22:30阅读:49来源:国知局
服务器内存故障检测方法、装置、电子设备及存储介质与流程

本发明涉及服务器,尤其涉及一种服务器内存故障检测方法、装置、电子设备及存储介质。


背景技术:

1、当服务器存在损坏的内存时,服务器开机会宕机在内存自检状态,由于此时未自检完成,虽然基本输入输出系统bios开启故障排除debug模式后,通过远程串口日志可以打印出具体的故障内存,但是bios此时仍未开始向基板管理控制器bmc推送信息,且服务器告警灯由bmc控制,所以此时服务器无法对故障内存进行告警,bmc也无法记录故障内存信息,仅通过宕机页面,无法对宕机现象进行排查。

2、因此,如何针对宕机现象进行服务器的故障进行排查,是当前亟需解决的技术问题。


技术实现思路

1、本发明提供一种服务器内存故障检测方法、装置、电子设备及存储介质,用以解决现有技术中仅通过宕机页面,无法对宕机现象进行排查的缺陷,实现针对宕机现象进行服务器的故障排查,从而确定引起服务器宕机的故障内存,并针对该故障内存进行告警提示。

2、本发明提供一种服务器内存故障检测方法,包括:

3、在服务器重启过程中,获取远程串口日志;

4、对所述远程串口日志进行检测,在确定所述远程串口日志中存在至少一个故障内存地址的情况下,确定所述故障内存引起所述服务器宕机;

5、基于所述至少一个故障内存地址确定告警信息,基于所述告警信息进行故障提示。

6、根据本发明提供的一种服务器内存故障检测方法,所述在服务器重启过程中,获取远程串口日志之前,还包括:

7、确定所述服务器宕机在自检状态;

8、开启基本输入输出系统的故障排除模式,并打开远程串口;

9、向服务器发送重启指令,以使所述服务器重启。

10、根据本发明提供的一种服务器内存故障检测方法,所述确定所述服务器宕机在自检状态,包括:

11、在所述服务器处于开机状态或重启状态的情况下,获取与所述基本输入输出系统之间的通信结果;

12、基于所述通信结果确定在预设时间内未接收所述基本输入输出系统发送的推送信息,确定所述服务器宕机在自检状态。

13、根据本发明提供的一种服务器内存故障检测方法,所述对所述远程串口日志进行检测,在确定所述远程串口日志中存在至少一个故障内存地址的情况下,确定所述故障内存引起所述服务器宕机之前,还包括:

14、确定所述远程串口日志停止更新,关闭所述远程串口;

15、所述对所述远程串口日志进行检测,在确定所述远程串口日志中存在至少一个故障内存地址的情况下,确定所述故障内存引起所述服务器宕机,包括:

16、对所述远程串口日志进行故障信息检测,判断是否为所述服务器内存故障引起所述服务器宕机;

17、在确定所述服务器内存故障的情况下,对故障的所述服务器内存进行定位,确定所述至少一个所述服务器内存对应的故障内存地址。

18、根据本发明提供的一种服务器内存故障检测方法,所述开启基本输入输出系统的故障排除模式,包括:

19、向所述基本输入输出系统发送第一指令,以使所述基本输入输出系统开启所述故障排除模式;

20、或,

21、在后台直接开启所述基本输入输出系统的故障排除模式。

22、根据本发明提供的一种服务器内存故障检测方法,所述在确定所述服务器内存故障的情况下,对故障的所述服务器内存进行定位,确定所述至少一个所述服务器内存对应的故障内存地址之后,还包括:

23、获取故障的所述服务器内存的内存信息,将所述内存信息和故障内存地址存储至告警日志中以供用户进行查看。

24、本发明还提供一种服务器内存故障检测装置,包括:

25、获取模块,用于在服务器重启过程中,获取远程串口日志;

26、检测模块,用于对所述远程串口日志进行检测,在确定所述远程串口日志中存在至少一个故障内存地址的情况下,确定所述故障内存引起所述服务器宕机;

27、告警模块,用于基于所述至少一个故障内存地址确定告警信息,基于所述告警信息进行故障提示。

28、本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述服务器内存故障检测方法。

29、本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述服务器内存故障检测方法。

30、本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述服务器内存故障检测方法。

31、本发明提供的服务器内存故障检测方法、装置、电子设备及存储介质,通过在服务器重启过程中,获取远程串口日志,然后对远程串口日志进行检测,在确定远程串口日志中存在至少一个故障内存地址的情况下,确定故障内存引起服务器宕机,最后基于至少一个故障内存地址确定告警信息,基于告警信息进行故障提示。本发明能够在服务器宕机进行重启时获取远程串口日志,通过远程串口日志确定是因服务器内存故障而引起的服务器宕机,并且能够确定故障内存地址生告警信息进行故障提示,从而实现对宕机现象进行服务器的故障排查。



技术特征:

1.一种服务器内存故障检测方法,其特征在于,应用于基板管理控制器bmc,方法包括:

2.根据权利要求1所述的服务器内存故障检测方法,其特征在于,所述在服务器重启过程中,获取远程串口日志之前,还包括:

3.根据权利要求2所述的服务器内存故障检测方法,其特征在于,所述确定所述服务器宕机在自检状态,包括:

4.根据权利要求2所述的服务器内存故障检测方法,其特征在于,所述对所述远程串口日志进行检测,在确定所述远程串口日志中存在至少一个故障内存地址的情况下,确定所述故障内存引起所述服务器宕机之前,还包括:

5.根据权利要求2所述的服务器内存故障检测方法,其特征在于,所述开启基本输入输出系统的故障排除模式,包括:

6.根据权利要求4所述的服务器内存故障检测方法,其特征在于,所述在确定所述服务器内存故障的情况下,对故障的所述服务器内存进行定位,确定所述至少一个所述服务器内存对应的故障内存地址之后,还包括:

7.一种服务器内存故障检测装置,其特征在于,应用于基板管理控制器bmc,装置包括:

8.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至6任一项所述服务器内存故障检测方法。

9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述服务器内存故障检测方法。

10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述服务器内存故障检测方法。


技术总结
本发明提供一种服务器内存故障检测方法、装置、电子设备及存储介质,所述方法应用于基板管理控制器BMC,包括:在服务器重启过程中,获取远程串口日志;对所述远程串口日志进行检测,在确定所述远程串口日志中存在至少一个故障内存地址的情况下,确定所述故障内存引起所述服务器宕机;基于所述至少一个故障内存地址确定告警信息,基于所述告警信息进行故障提示。本发明能够在服务器宕机进行重启时获取远程串口日志,通过远程串口日志确定是因服务器内存故障而引起的服务器宕机,并且能够确定故障内存地址生告警信息进行故障提示,从而实现对宕机现象进行服务器的故障排查。

技术研发人员:李洋
受保护的技术使用者:苏州浪潮智能科技有限公司
技术研发日:
技术公布日:2024/1/14
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1