故障信息获取方法、装置、基板管理控制器、系统及介质与流程

文档序号:35924987发布日期:2023-11-04 13:58阅读:29来源:国知局
故障信息获取方法、装置、基板管理控制器、系统及介质与流程

本发明涉及处理器故障检测领域,特别涉及一种故障信息获取方法、装置、基板管理控制器、系统及介质。


背景技术:

1、中央处理器(cpu)作为主机设备的核心部件,其故障情况将直接影响主机设备的整体性能。相关技术中,中央处理器可将自身故障情况通过可编程逻辑器件主动发送至基板管理控制器(bmc,baseboard management controller)。但对于无法主动与基板管理控制器通信的中央处理器而言,基板管理控制器将无法确定中央处理器是否发生故障,进而无法获取到中央处理器的故障信息。


技术实现思路

1、本发明的目的是提供一种故障信息获取方法、装置、基板管理控制器、系统及介质,可利用基板管理控制器主动检测中央处理器的故障情况及主动收集中央处理器的故障信息,从而可提升对中央处理器进行故障检测的可靠性。

2、为解决上述技术问题,本发明提供一种故障信息获取方法,应用于基板管理控制器,所述方法包括:

3、与主机设备的中央处理器构建通信通道;

4、通过所述通信通道与所述中央处理器进行通信,并根据所述中央处理器的通信响应状态判断所述中央处理器是否故障;

5、当确定所述中央处理器故障时,通过所述通信通道控制所述中央处理器停止处理当前业务,并通过集成电路互连总线读取所述中央处理器的寄存器数据,以将所述寄存器数据作为所述中央处理器的故障信息。

6、可选地,所述与主机设备的中央处理器构建通信通道,包括:

7、创建虚拟的usb网卡设备;

8、与所述中央处理器构建usb链路连接,以使所述中央处理器在完成所述usb链路连接的构建后,将所述usb网卡设备加载至所述主机设备;

9、为所述usb网卡设备初始化网络配置信息,并控制所述usb网卡设备和与所述主机设备中的物理网卡设备构建网络连接;

10、利用所述usb链路连接和所述网络连接与所述中央处理器构建所述通信通道。

11、可选地,所述与主机设备的中央处理器构建通信通道,包括:

12、利用显卡单元及高速串行计算机扩展总线与所述中央处理器构建所述通信通道;所述显卡单元设置于所述基板管理控制器中。

13、可选地,所述通过所述通信通道控制所述中央处理器停止处理当前业务,包括:

14、通过所述通信通道向所述中央处理器发送中断信号,以使所述中央处理器停止处理当前业务。

15、可选地,所述通过集成电路互连总线读取所述中央处理器的寄存器数据,包括:

16、利用中央处理器在所述集成电路互连总线中的总线地址以及所述中央处理器的寄存器对应的寄存器地址生成寄存器读取命令;

17、通过所述集成电路互联总线向所述中央处理器发送所述寄存器读取命令,以使所述中央处理器根据所述寄存器读取命令中的总线地址响应寄存器读取命令,并向所述基板管理控制器返回所述寄存器读取命令中的寄存器地址对应的寄存器数据。

18、可选地,在通过集成电路互连总线读取所述中央处理器的寄存器数据之后,还包括:

19、将所述寄存器数据保存至存储设备。

20、可选地,所述通过所述通信通道与所述中央处理器进行通信,并根据所述中央处理器的通信响应状态判断所述中央处理器是否故障,包括:

21、周期性通过所述通信通道向所述中央处理器发送消息,并判断所述中央处理器是否在预设时间内响应所述消息;

22、若是,则判定所述中央处理器未发生故障;

23、若否,则判定所述中央处理器已发生故障。

24、本发明还提供一种故障信息获取装置,应用于基板管理控制器,所述装置包括:

25、通信通道构造模块,用于与主机设备的中央处理器构建通信通道;

26、故障检测模块,用于通过所述通信通道与所述中央处理器进行通信,并根据所述中央处理器的通信响应状态判断所述中央处理器是否故障;

27、故障信息获取模块,用于当确定所述中央处理器故障时,通过所述通信通道控制所述中央处理器停止处理当前业务,并通过集成电路互连总线读取所述中央处理器的寄存器数据,以将所述寄存器数据作为所述中央处理器的故障信息。

28、本发明还提供一种基板管理控制器,包括:

29、存储器,用于存储计算机程序;

30、处理器,用于执行所述计算机程序时实现如上所述的故障信息获取方法。

31、本发明还提供一种故障信息获取系统,包括:

32、主机设备,所述主机设备中包含中央处理器,所述中央处理器用于与基板管理控制器建立通信通道,通过所述通信通道响应所述基板管理控制器发起的通信,在所述基板管理控制器通过所述通信通道的控制下停止处理当前业务,以及通过集成电路互连总线向所述基板管理控制器返回寄存器数据;

33、所述基板管理控制器,用于执行如上所述的故障信息获取方法。

34、本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机可执行指令,所述计算机可执行指令被处理器加载并执行时,实现如上所述的故障信息获取方法。

35、本发明提供一种故障信息获取方法,应用于基板管理控制器,所述方法包括:与主机设备的中央处理器构建通信通道;通过所述通信通道与所述中央处理器进行通信,并根据所述中央处理器的通信响应状态判断所述中央处理器是否故障;当确定所述中央处理器故障时,通过所述通信通道控制所述中央处理器停止处理当前业务,并通过集成电路互连总线读取所述中央处理器的寄存器数据,以将所述寄存器数据作为所述中央处理器的故障信息。

36、可见,在本发明中,基板管理控制器可主动与主机设备中的中央处理器构建通信通道,并通过该通信通道与中央处理器进行通信,以根据中央处理器的通信响应状态来判断中央处理器是否故障。假若确定中央处理器已发生故障,则基板管理控制器可进一步通过集成电路互连总线读取所述中央处理器的寄存器数据,以将寄存器数据作为中央处理器的故障信息,进而可利用基板管理控制器主动检测中央处理器的故障情况及主动收集中央处理器的故障信息,从而可提升对中央处理器进行故障检测的可靠性。本发明还提供一种故障信息获取装置、基板管理控制器、系统及介质,具有上述有益效果。



技术特征:

1.一种故障信息获取方法,其特征在于,应用于基板管理控制器,所述方法包括:

2.根据权利要求1所述的故障信息获取方法,其特征在于,所述与主机设备的中央处理器构建通信通道,包括:

3.根据权利要求1所述的故障信息获取方法,其特征在于,所述与主机设备的中央处理器构建通信通道,包括:

4.根据权利要求1所述的故障信息获取方法,其特征在于,所述通过所述通信通道控制所述中央处理器停止处理当前业务,包括:

5.根据权利要求1所述的故障信息获取方法,其特征在于,所述通过集成电路互连总线读取所述中央处理器的寄存器数据,包括:

6.根据权利要求1所述的故障信息获取方法,其特征在于,在通过集成电路互连总线读取所述中央处理器的寄存器数据之后,还包括:

7.根据权利要求1至6任一项所述的故障信息获取方法,其特征在于,所述通过所述通信通道与所述中央处理器进行通信,并根据所述中央处理器的通信响应状态判断所述中央处理器是否故障,包括:

8.一种故障信息获取装置,其特征在于,应用于基板管理控制器,所述装置包括:

9.一种基板管理控制器,其特征在于,包括:

10.一种故障信息获取系统,其特征在于,包括:

11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机可执行指令,所述计算机可执行指令被处理器加载并执行时,实现如权利要求1至7任一项所述的故障信息获取方法。


技术总结
本发明提供一种故障信息获取方法、装置、基板管理控制器、系统及介质,方法应用于基板管理控制器,包括:与主机设备的中央处理器构建通信通道;通过所述通信通道与所述中央处理器进行通信,并根据所述中央处理器的通信响应状态判断所述中央处理器是否故障;当确定所述中央处理器故障时,通过所述通信通道控制所述中央处理器停止处理当前业务,并通过集成电路互连总线读取所述中央处理器的寄存器数据,以将所述寄存器数据作为所述中央处理器的故障信息;可利用基板管理控制器主动检测中央处理器的故障情况及主动收集中央处理器的故障信息,从而可提升对中央处理器进行故障检测的可靠性。

技术研发人员:张国磊,王宏伟
受保护的技术使用者:浪潮(山东)计算机科技有限公司
技术研发日:
技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1