本发明涉及计算机,特别涉及一种龙芯平台内存训练情况检验方法、装置、设备及介质。
背景技术:
1、龙芯3c5000平台采用完全自主的loongarch指令架构,可满足通用计算、大型数据中心、云计算中心的计算需求。
2、在服务器开机阶段初期,会先运行龙芯平台的初始化程序,并在龙芯平台的串口同步输出程序的运行情况。在运行龙芯平台的初始化程序过程中,如果出现内存训练失败的问题,初始化程序会立即停止运行,龙芯平台的串口也会停止输出内容,此时需要通过串口日志排查相关问题。
3、传统技术只能通过工程师分析串口日志才能找到故障内存位置,进一步的,工程师将故障内存位置告知产线的安装人员,产线安装人员再进行相关的内存拔插或者内存更换工作。可见,这种方式大大浪费了时间成本和人力成本,效率较低。
技术实现思路
1、有鉴于此,本发明的目的在于提供一种龙芯平台内存训练情况检验方法、装置、设备及介质,能够自动实现龙芯平台内存训练情况的检验,大大节省了时间成本和人力成本,其具体方案如下:
2、第一方面,本技术公开了一种龙芯平台内存训练情况检验方法,包括:
3、服务器上电后,对基板管理控制器进行初始化,并开启所述基板管理控制器的预设串口重定向功能,以等待龙芯平台串口输出相应的串口日志;
4、服务器开机后,开启目标计时器,并对龙芯平台进行初始化;其中,所述目标计时器用于监测所述龙芯平台的初始化时长;
5、通过所述基板管理控制器接收所述龙芯平台串口输出的所述串口日志,并判断所述目标计时器的计时值是否达到预设计时阈值;
6、若所述目标计时器的计时值达到所述预设计时阈值,则判断所述基板管理控制器是否接收到目标标志信息,若所述基板管理控制器未接收到所述目标标志信息则对所述串口日志进行读取,并根据读取结果检验所述龙芯平台的内存训练情况。
7、可选的,所述判断所述基板管理控制器是否接收到目标标志信息,包括:
8、判断所述基板管理控制器是否接收到基本输入输出系统发送的目标状态码;其中,所述目标状态码为标志所述龙芯平台初始化完成的状态码。
9、可选的,所述判断所述基板管理控制器是否接收到目标标志信息之后,还包括:
10、若所述基板管理控制器接收到所述目标标志信息,则判定所述龙芯平台初始化完成,并关闭以及清除所述目标计时器,以退出对所述龙芯平台的内存训练情况的检验。
11、可选的,所述对所述串口日志进行读取,并根据读取结果检验所述龙芯平台的内存训练情况,包括:
12、对所述串口日志进行读取,若从所述串口日志中读取到目标关键字,则判定所述龙芯平台的外围电路初始化失败。
13、可选的,所述判定所述龙芯平台的外围电路初始化失败之后,还包括:
14、基于所述外围电路初始化失败的时间信息以及用于表明所述外围电路初始化失败的第一失败类型生成第一告警日志,并关闭以及清除所述目标计时器。
15、可选的,所述对所述串口日志进行读取,并根据读取结果检验所述龙芯平台的内存训练情况,包括:
16、对所述串口日志进行读取,若从所述串口日志中未读取到所述目标关键字,则判定所述龙芯平台的内存训练失败;
17、确定与所述龙芯平台的内存训练相关的目标格式信息,并根据所述目标格式信息读取所述串口日志的内存信息;
18、从所述串口日志的所述内存信息中读取目标龙芯平台编号、目标内存控制器编号以及目标内存插槽关键字;
19、根据主板设计情况将所述目标龙芯平台编号、所述目标内存控制器编号以及所述目标内存插槽关键字转换为所述主板的丝印位置;
20、基于内存训练失败的时间信息、用于表明内存训练失败的第二失败类型以及所述丝印位置生成第二告警日志;
21、在所述基板管理控制器的目标页面对所述第二告警日志进行显示,并基于所述第二告警日志点亮相应的故障灯,然后关闭以及清除所述目标计时器。
22、可选的,所述通过所述基板管理控制器接收所述龙芯平台串口输出的所述串口日志之后,还包括:
23、将所述串口日志保存至所述基板管理控制器的目标存储区域;
24、相应的,所述对所述串口日志进行读取,包括:
25、从所述目标存储区域中确定所述串口日志,并对所述串口日志进行读取。
26、第二方面,本技术公开了一种龙芯平台内存训练情况检验装置,包括:
27、重定向模块,用于服务器上电后,对基板管理控制器进行初始化,并开启所述基板管理控制器的预设串口重定向功能,以等待龙芯平台串口输出相应的串口日志;
28、平台初始化模块,用于服务器开机后,开启目标计时器,并对龙芯平台进行初始化;其中,所述目标计时器用于监测所述龙芯平台的初始化时长;
29、串口日志接收模块,用于通过所述基板管理控制器接收所述龙芯平台串口输出的所述串口日志,并判断所述目标计时器的计时值是否达到预设计时阈值;
30、内存训练检验模块,用于若所述目标计时器的计时值达到所述预设计时阈值,则判断所述基板管理控制器是否接收到目标标志信息,若所述基板管理控制器未接收到所述目标标志信息则对所述串口日志进行读取,并根据读取结果检验所述龙芯平台的内存训练情况。
31、第三方面,本技术公开了一种电子设备,包括:
32、存储器,用于保存计算机程序;
33、处理器,用于执行所述计算机程序,以实现前述公开的龙芯平台内存训练情况检验方法。
34、第四方面,本技术公开了一种计算机可读存储介质,用于保存计算机程序;其中,所述计算机程序被处理器执行时实现前述公开的龙芯平台内存训练情况检验方法。
35、可见,本技术提出了一种龙芯平台内存训练情况检验方法,包括:服务器上电后,对基板管理控制器进行初始化,并开启所述基板管理控制器的预设串口重定向功能,以等待龙芯平台串口输出相应的串口日志;服务器开机后,开启目标计时器,并对龙芯平台进行初始化;其中,所述目标计时器用于监测所述龙芯平台的初始化时长;通过所述基板管理控制器接收所述龙芯平台串口输出的所述串口日志,并判断所述目标计时器的计时值是否达到预设计时阈值;若所述目标计时器的计时值达到所述预设计时阈值,则判断所述基板管理控制器是否接收到目标标志信息,若所述基板管理控制器未接收到所述目标标志信息则对所述串口日志进行读取,并根据读取结果检验所述龙芯平台的内存训练情况。综上可见,本技术首先通过基板管理控制器的预设串口重定向功能获取龙芯平台串口输出的串口日志,并设定目标计时器以监测龙芯平台的初始化时长,当目标计时器的计时值达到预设计时值阈值,则表明龙芯平台的初始化出现异常,进一步的,基于基本管理控制器是否接收到目标标志信息来判断龙芯平台的初始化是否完成,若基板管理控制器未接收到目标标志信息,则说明龙芯平台初始化未完成,则需要对串口日志进行读取以便根据读取结果检验龙芯平台的内存训练情况。如此一来,本技术可在全程无人值守的情况下自动实现龙芯平台的内存训练情况的检验,大大节省了时间成本和人力成本,提高了内存训练的检验效率。