一种获取故障信息的方法及装置的制造方法

文档序号:9750689阅读:292来源:国知局
一种获取故障信息的方法及装置的制造方法
【技术领域】
[0001]本发明涉及通信技术领域,尤其涉及一种存储崩溃信息的方法及装置
【背景技术】
[0002]目前通用服务器一般都具有黑匣子功能,在服务器的系统崩溃时,黑匣子能够获取系统崩溃时的信息,并将该信息进行保存在非易失性存储上,即使系统重启,这些信息也不会丢失,能够提供开发人员快速定位系统故障的重要依据,利于系统(英文=OperatingSystem,简称OS)的诊断。
[0003]现有服务器的系统中的黑匣子功能是基于基板管理控制器模块(Baseboar(!management controller, BMC)来实现的,系统板在系统(Linux)内核中插入内核黑匣子(英文=Kernel Blaxk box,简称:ΚΒ0Χ)模块,在系统发生异常即将复位时,抓取系统崩溃信息,快捷外设互联标准(英文〖Peripheral Component Interconnect Express,简称:PCIe)与BMC模块上的现场可编程逻辑门阵列(英文:Field Programmable Gate Array,简称:FPGA)交互,然后由FPGA通过双倍速率同步动态随机存储器(Double Data Rate, DDR)的控制器将崩溃信息保存到BMC模块上的DDR内存空间中,再将DDR内存中的崩溃信息保存到对应的硬盘中。
[0004]然而,现有的服务器的系统开始趋向微小型的方向发展,微小型系统的体积小,出于布局空间的考虑,系统中往往没有BMC,当系统发生崩溃时,无法将获取到的崩溃信息存储至非易失性存储器中,从而无法实现黑匣子功能。

【发明内容】

[0005]本发明实施例提供了一种存储崩溃信息的方法,可在无BMC模块时,将崩溃信息存储到服务器的第二 CPU的非易失性存储器中,从而实现黑匣子功能。
[0006]本发明实施例,第一方面一种用于服务器的崩溃信息存储方法,所述服务器中包括第一硬件系统及第二硬件系统,所述第一硬件系统包括第一 CPU及第一内存,所述第二硬件系统包括第二 CPU、第二内存及非易失性存储器,所述方法包括:
[0007]当所述第一硬件系统满足崩溃条件时,所述服务器获取所述第一硬件系统的崩溃信息,并将所述崩溃信息保存至所述第一内存中;
[0008]所述服务器将所述第一内存中的所述崩溃信息镜像至所述第二内存中;
[0009]所述服务器将所述第二内存中的崩溃信息存储至所述非易失性存储器中。
[0010]结合本发明实施例的第一方面,在本发明实施例第一方面的第一种实现方式中,所述服务器将所述第一内存中的所述崩溃信息镜像至所述第二内存中之前,包括:
[0011]建立所述第一内存到所述第二内存的镜像通道,所述镜像通道用于,把所述第一内存中保存的所述崩溃信息,经过所述第一 CPU、所述第二 CPU镜像到所述第二内存。
[0012]结合本发明实施例的第一方面或第一方面的第一种实现方式,在本发明实施例第一方面的第二种实现方式中,所述服务器将所述第一内存中的所述崩溃信息镜像至所述第二内存中,包括:
[0013]所述服务器将所述第一内存中的崩溃信息通过所述第一内存与所述第一 CPU之间的第一内存通道发送至所述第一 CPU中;
[0014]所述服务器将所述第一 CPU中的崩溃信息通过所述第一 CPU与所述第二 CPU之间的PCIE通道发送至所述第二 CPU中;
[0015]所述服务器将所述第二 CPU中的崩溃信息通过所述第二 CPU与所述第二内存之间的第二内存通道发送至所述第二内存中。
[0016]结合本发明实施例的第一方面的第二种实现方式,在本发明实施例第一方面的第三种实现方式中,所述服务器将所述第一内存中的崩溃信息通过所述第一内存与所述第一CPU之间的第一内存通道发送至所述第一 CPU中,所述服务器将所述第一 CPU中的崩溃信息通过所述第一 CPU与所述第二 CPU之间的PCIE通道发送至所述第二 CPU中,所述服务器将所述第二 CPU中的崩溃信息通过所述第二 CPU与所述第二内存之间的第二内存通道发送至所述第二内存中,包括:
[0017]所述服务器将所述第一内存中的所述崩溃信息,映射至与所述第一内存具有映射关系的第一端口,所述第一端口属于所述第一 CPU ;
[0018]所述服务器将所述第一 CPU中的所述崩溃信息,映射至与所述第一 CPU具有映射关系的第二端口,所述第二端口属于所述第二 CPU ;
[0019]所述服务器将所述第二 CPU中的所述崩溃信息,映射至与所述第二 CPU具有映射关系的第二内存中。
[0020]结合本发明实施例的第一方面的第二种实现方式,在本发明实施例第一方面的第四种实现方式中,所述第一内存包括N个内存区域;
[0021]所述服务器将所述崩溃信息保存至所述第一内存包括,
[0022]所述服务器将所述崩溃信息保存至所述N个内存区域中的第一内存区域中,所述N为大于I的正整数;
[0023]所述服务器将所述第一内存中的崩溃信息通过所述第一内存与所述第一 CPU之间的第一内存通道发送至所述第一 CPU中,所述服务器将所述第一 CPU中的崩溃信息通过所述第一 CPU与所述第二 CPU之间的PCIE通道发送至所述第二 CPU中,所述服务器将所述第二 CPU中的崩溃信息通过所述第二 CPU与所述第二内存之间的第二内存通道发送至所述第二内存中,包括,
[0024]所述服务器向所述第一内存的第二内存区域发送所述第一内存的第一内存区域中的所述崩溃息;
[0025]所述服务器向所述第一内存的第二内存区域发送所述第一内存的第一内存区域中的所述崩溃息;
[0026]所述服务器将所述第一内存的第二内存区域中的所述崩溃信息映射至与所述第一内存的第二内存区域具有映射关系的第三端口,所述第三端口属于所述第一 CPU;
[0027]所述服务器将所述第一 CPU中的所述崩溃信息映射至与所述第三端口具有映射关系的第四端口,所述第四端口属于所述第二 CPU ;
[0028]所述服务器将所述第二 CPU中的所述崩溃信息映射至与所述第四端口具有映射关系的所述第二内存的第一内存区域中。
[0029]本发明实施例第二方面提供一种用于服务器的崩溃信息存储方法,所述服务器中包括第一硬件系统及第二硬件系统,所述第一硬件系统包括第一 CPU及第一内存,所述第二硬件系统包括第二 CPU、第二内存及非易失性存储器,所述方法包括:
[0030]当所述第一硬件系统满足崩溃条件时,所述服务器获取所述第一硬件系统的崩溃信息,并将所述崩溃信息保存至所述第一内存中;
[0031]所述服务器通过所述第一 CPU与所述第二 CPU之间的以太网通道,向所述第二内存发送所述第一内存中的所述崩溃信息;
[0032]所述服务器将所述第二内存中的崩溃信息存储至所述非易失性存储器中。
[0033]本发明实施例第三方面提供一种服务器,包括:
[0034]获取单元,用于当所述第一硬件系统满足崩溃条件时,获取所述第一硬件系统的崩溃息;
[0035]保存单元,用于将所述崩溃信息保存至所述第一内存中;
[0036]镜像单元,用于将所述第一内存中的所述崩溃信息镜像至所述第二内存中;
[0037]存储单元,用于将所述第二内存中的崩溃信息存储至所述非易失性存储器中。
[0038]结合本发明实施例的第三方面,在本发明实施例的第三方面的第一种实现方式中,所述镜像单元包括:
[0039]建立单元,用于建立所述第一内存到所述第二内存的镜像通道,所述镜像通道用于,把所述第一内存中保存的所述崩溃信息,经过所述第一 CPU、所述第二 CPU镜像到所述第二内存。
[0040]结合本发明实施例的第三方面的第一种实现方式,在本发明实施例的第三方面的第二种实现方式中,所述镜像单元包括:
[0041]第一发送模块,用于将所述第一内存中的崩溃信息通过所述第一内存与所述第一CPU之间的第一内存通道发送至所述第一 CPU中;
[0042]第二发送模块,用于将所述第一 CPU中的崩溃信息通过所述第一 CPU与所述第二CPU之间的PCIE通道发送至所述第二 CPU中;
[0043]第三发送模块,用于将所述第二 CPU中的崩溃信息通过所述第二 CPU与所述第二内存之间的第二内存通道发送至所述第二内存中。
[0044]结合本发明实施例的第三方面的第二种实现方式,在本发明实施例的第三方面的第三种实现方式中,所述第一发送模块包括第一映射子模块,所述第二发送模块包括第二映射子模块,所述第三发送模块包括第三映射子模块;
[0045]所述第一映射子模块,用于将所述第一内存中的所述崩溃信息,映射至与所述第一内存具有映射关系的第一端口,所述第一端口属于所述第一 CPU ;
[0046]所述第二映射子模块,用于将所述第一 CPU中的所述崩溃信息,映射至与所述第一CPU具有映射关系的第二端口,所述第二端口属于所述第二 CPU中;
[0047]所述第三映射子模块,用于将所述第二 CPU中的所述崩溃信息,映射至与所述第二CPU具有映射关系的第二内存中。
[0048]结合本发明实施例的第三方面的第二种实现方式,在本发明实施例的第三方面的第四种实现方式中,所述保存单元包括,
[0049]保存模块,用于将所述崩溃信息保存至所述N个内存区域中的第一内存区域中,所述N为大于I的正整数;
[0050]所述第一发送模块包括发送子模块及第四映射子模块,所述第二发送模块包括第五映射子模块,所述第三发送模块包括第六映射子模块;
[0051]所述发送子模块,用于向所述第一内存的第二内存区域发送所述第一内存的第一内存区域中的所述崩溃信息;
[0052]第四映射子模块,将所述第一内存的第二内存区域中的所述崩溃信息映射至与所述第一内存的第二内存区域具有映射关系的第三端口所属的所述第一CPU中;
[0053]第五映射子模块,用于将所述第一 CPU中的所述崩溃信息映射至与所述第三端口具有映射关系的第四端所属的所述第二 CPU中;
[0054]第六映射子模块,用于将所述第二 CPU中的所述崩溃信息映射至与所述第四端具有映射关系的所述第二内存的第一内存区域中。
[0055]本发明实施例第四方面一种服务器,包括:
[0056]获取单元,用于当所述第一硬件系统满足崩溃条件时,获取所述第一硬件系统的崩溃信息,并将所述崩溃信息保存至所述第一内存中;
[0057]发送单元,用于通过所述第一 CPU与所述第二 CPU之间的以太网通道,向所述第二内存发送所述第一内存中的所述崩溃信息;
[0058]存储单元,用于将所述第二内存中的崩溃信息存储至所述非易失性存储器中。
[0059]本发明实施例具有如下优点:
[0060]通过在第一硬件系统崩溃时,服务器获取第一硬件系统中的崩溃信息,在将该崩溃信息保存到第一内存中,然后再将该第一内存中的崩溃信息镜像至第二内存中,再将该第二内存中的崩溃信息保存到第二硬件系统的非易失性存储中,从而在服务器中无BMC模块时,实现黑匣子功能。
【附图说明】
[0061]图1为本发明实施例中一种崩溃信息存储方法的一个实施例示意图;
[0062]图2为本发明实施例中一种崩溃信息存储方法的另一个实施例示意图;
[0063]图
当前第1页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1