本发明涉及挂死调试,具体涉及管理引擎挂死的调试方法、装置、设备及存储介质。
背景技术:
1、管理引擎(management engine,me)起着管理平台路径控制器(platformcontroller hub,pch)与其他固件之间协调沟通的重要作用,当出现管理引擎挂死现象时,系统会出现宕机以及重启不开机等重大问题,导致系统不能正常工作。同时,管理引擎挂死的异常通常会导致服务器不开机,不能直接、实时获取异常的数据信息,难以实现挂死复现及异常定位,导致不能快速或者不能查找出管理引擎挂死的原因。
技术实现思路
1、有鉴于此,本发明提供了一种管理引擎挂死的调试方法、装置、计算机设备及存储介质,以解决管理引擎挂死时无法直接和实时获取异常的数据信息,难以实现挂死复现及异常定位,导致不能快速或者不能查找出管理引擎挂死的原因的问题。
2、第一方面,本发明提供了一种管理引擎挂死的调试方法,应用于基板管理控制器,基板管理控制器、复杂可编程逻辑器件和平台路径控制器两两通信连接;该方法包括:
3、当检测到管理引擎出现异常状态时,获取平台路径控制器的状态信息;异常状态的异常状态信息是复杂可编程逻辑器件与平台路径控制器的通信获得并发送至基板管理控制器的;
4、基于状态信息,对管理引擎进行调试,以确定管理引擎的异常来源。
5、如此,可以在管理引擎出现异常状态时,通过获取平台路径控制器的状态信息对管理引擎进行调试,从而确定管理引擎的异常来源,提高了管理引擎挂死时相关调试信息获取的及时性与完整性,进而提高了管理引擎挂死的调试效率。
6、在一种可选的实施方式中,基于状态信息,对管理引擎进行调试,以确定管理引擎的异常来源,包括:
7、当状态信息为第一状态值时,检测管理引擎的供电信号;
8、当供电信号处于第一供电值的时间低于预设时间时,获取平台路径控制器的寄存器信息,并基于寄存器信息确定管理引擎的异常来源。
9、如此,可以在状态信息为对应于异常状态的第一状态值,并且确定供电信号没有问题的情况下,根据平台路径控制器的寄存器信息进一步确定管理引擎的异常来源。
10、在一种可选的实施方式中,当状态信息为第一状态值时,检测管理引擎的供电信号之后,还包括:
11、当供电信号处于第一供电值的时间超过预设时间时,对平台路径控制器进行开机操作和/或强制关机操作;开机操作响应于发送给平台路径控制器的开机指令;强制关机操作响应于发送给平台路径控制器的强制关机指令;
12、当检测到管理引擎恢复正常状态时,确定异常来源为平台路径控制器强制关机。
13、如此,可以在状态信息为对应于异常状态的第一状态值,并且确定供电信号存在问题的情况下,通过对平台路径控制器进行开机操作和/或强制关机操作,在确定异常来源为平台路径控制器强制关机的同时使管理引擎恢复正常状态。
14、在一种可选的实施方式中,当供电信号处于第一供电值的时间超过预设时间时,对平台路径控制器进行开机操作和/或强制关机操作之后,还包括:
15、当检测到管理引擎保持异常状态时,获取平台路径控制器的寄存器信息,并基于寄存器信息确定管理引擎的异常来源。
16、如此,可以在状态信息为对应于异常状态的第一状态值,并且确定供电存在问题的情况下,通过对平台路径控制器进行开机操作和/或强制关机操作,而管理引擎没有恢复正常状态,来排除平台路径控制器强制关机的问题,根据平台路径控制器的寄存器信息进一步确定管理引擎的异常来源。
17、在一种可选的实施方式中,基于状态信息,对管理引擎进行调试,以确定管理引擎的异常来源,包括:
18、当状态信息为第二状态值时,确定异常来源为平台路径控制器强制关机,或,确定管理引擎复位后正常工作。
19、在一种可选的实施方式中,基于状态信息,对管理引擎进行调试,以确定管理引擎的异常来源,包括:
20、当状态信息既不是第一状态值也不是第二状态值时,对管理引擎进行复位操作;复位操作响应于发送给平台路径控制器的复位指令;
21、当复位操作小于等于预设数量时,获取平台路径控制器的状态信息,以基于状态信息,对管理引擎进行调试。
22、如此,可以在状态信息既不是对应于异常状态的第一状态值也不是对应于正常状态的第二状态值的情况下,通过对管理引擎进行复位操作,对管理引擎进行调试,使管理引擎在没有出现问题的情况下能够恢复正常状态。
23、在一种可选的实施方式中,当状态信息既不是第一状态值也不是第二状态值时,对管理引擎进行复位操作之后,还包括:
24、当复位操作大于预设数量时,获取平台路径控制器的寄存器信息,并基于寄存器信息确定管理引擎的异常来源。
25、如此,可以在状态信息既不是对应于异常状态的第一状态值也不是对应于正常状态的第二状态值的情况下,对管理引擎进行复位操作,在多次复位操作无法使管理引擎恢复正常状态时,根据平台路径控制器的寄存器信息进一步确定管理引擎的异常来源。
26、在一种可选的实施方式中,基于寄存器信息确定管理引擎的异常来源,包括:
27、当寄存器信息中包含开机响应信号时,获取调试信息以确定异常来源;开机响应信号为基板管理控制器读取平台路径控制器获得;
28、当寄存器信息中不包含开机响应信号和深度睡眠应答信号时,确定异常来源为复杂可编程逻辑器件控制逻辑异常;深度睡眠应答信号为基板管理控制器通过复杂可编程逻辑器件读取平台路径控制器获得;
29、当寄存器信息中不包含开机响应信号和串行外围设备接口控制信号,并且寄存器信息中包含深度睡眠应答信号时,确定异常来源为串行外围设备接口控制切换异常;串行外围设备接口控制信号为基板管理控制器通过复杂可编程逻辑器件读取平台路径控制器获得;
30、和/或,当寄存器信息中不包含开机响应信号,并且寄存器信息中包含深度睡眠应答信号和串行外围设备接口控制信号时,确定异常来源为串行外围设备接口链路稳定性异常。
31、如此,可以根据寄存器信息中的相关信息,逐步排查并确定管理引擎的异常来源,从而提高管理引擎挂死的调试效率。
32、第二方面,本发明提供了一种管理引擎挂死的调试装置,应用于基板管理控制器,基板管理控制器、复杂可编程逻辑器件和平台路径控制器两两通信连接;该装置包括:
33、状态信息获取模块,用于当检测到管理引擎出现异常状态时,获取平台路径控制器的状态信息;异常状态的状态信息是复杂可编程逻辑器件与平台路径控制器的通信获得并发送至基板管理控制器的;
34、异常来源确定模块,用于基于状态信息,对管理引擎进行调试,以确定管理引擎的异常来源。
35、第三方面,本发明提供了一种计算机设备,包括:存储器和处理器,存储器和处理器之间互相通信连接,存储器中存储有计算机指令,处理器通过执行计算机指令,从而执行上述第一方面或其对应的任一实施方式的管理引擎挂死的调试方法。
36、第四方面,本发明提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机指令,计算机指令用于使计算机执行上述第一方面或其对应的任一实施方式的管理引擎挂死的调试方法。