服务器的系统错误信息侦测系统及方法

文档序号:6509203阅读:293来源:国知局
服务器的系统错误信息侦测系统及方法
【专利摘要】一种服务器的系统错误信息侦测系统及方法,该服务器包括BMC芯片和BIOS芯片。该方法包括:在BMC芯片中定义一个系统错误码与系统错误信息的错误对照关系表;开启BMC芯片与BIOS芯片之间的LPC总线,并在BIOS芯片中设置一个用于获取服务器的系统启动信息的主板端口;当服务器正常启动时,通过LPC总线从主板端口中获取服务器的系统启动信息并保存在系统侦测文件中;当服务器发生故障时,利用系统侦测文件从保存在错误对照关系表中获取系统错误码;根据BMC芯片中的错误对照关系表解析出获取的系统错误码对应的系统错误信息。本发明能够准确快速简便地找出服务器的系统故障原因,以便尽快完成服务器的系统故障修复。
【专利说明】服务器的系统错误信息侦测系统及方法

【技术领域】
[0001]本发明涉及一种计算机错误侦测系统及方法,特别是关于一种服务器的系统错误信息侦测系统及方法。

【背景技术】
[0002]服务器的应用在当今信息社会应用的越来越广泛,其性能好,安全性高,从而得到了用户的好评。在服务器使用过程中,不论研发人员或用户,都会地对服务器进行开关机、重新启动、强制关机、断电等许多操作。这时,服务器就有可能因为各种各样的故障原因而无法进入操作系统,但却不能确定具体的故障原因,无法继续利用服务器唤醒工作。当这样的情况发生时,用户经常需要将服务器无法启动的各种故障原因都考虑其中,花费大量的时间来对服务器进行调试修复,耗费时间非常巨大,影响了需要依靠服务器来完成的工作。
[0003]对于服务器不能进入操作系统的常用调试方法是利用调试(Debug)卡插在服务器的主板端口(例如PortSO)上来获得服务器的故障信息,从而对服务器进行调试修复。然而,这种调试方法对于普通用户来说很难实现,并且不能将错误信息保存下来,不方便用户随时查看故障原因。尤其对拥有大量服务器的数据中心(Data Center)来说,这种调试方法更加耗时,并且成本较高,难以实现。


【发明内容】

[0004]鉴于以上内容,有必要提供一种服务器的系统错误信息侦测系统及方法,能够准确快速简便地找出服务器的系统故障原因,以便尽快完成服务器的系统故障修复。
[0005]所述服务器的系统错误信息侦测系统,该服务器包括BMC芯片以及B1S芯片。该系统包括:设置模块,用于定义一个系统错误码与系统错误信息的错误对照关系表,将该错误对照关系表保存在BMC芯片的存储器中,开启BMC芯片与B1S芯片之间的LPC总线,以及在B1S芯片中设置一个用于获取服务器的系统启动信息的主板端口 ;侦测模块,用于当服务器正常启动时,通过LPC总线从所述主板端口中实时获取服务器的系统启动信息,并将系统启动信息保存在所述存储器的系统侦测文件中,当服务器发生故障时,利用所述系统侦测文件从保存在所述错误对照关系表中获取系统错误码;解析模块,用于根据BMC芯片中的错误对照关系表解析出获取的系统错误码对应的系统错误信息,以及将系统错误信息记录在服务器的系统日志表中。
[0006]所述服务器的系统错误信息侦测方法,该服务器包括BMC芯片以及B1S芯片。该方法包括步骤:定义一个系统错误码与系统错误信息的错误对照关系表,并将该错误对照关系表保存在BMC芯片的存储器中;开启BMC芯片与B1S芯片之间的LPC总线,并在B1S芯片中设置一个用于获取服务器的系统启动信息的主板端口 ;当服务器正常启动时,通过LPC总线从主板端口中实时获取服务器的系统启动信息,并将系统启动信息保存在存储器的系统侦测文件中;当服务器发生故障时,利用系统侦测文件从保存在所述错误对照关系表中获取系统错误码;根据BMC芯片中的错误对照关系表解析出获取的系统错误码对应的系统错误信息,并将系统错误信息记录在服务器的系统日志表中。
[0007]相较于现有技术,当服务器在启动过程中发生故障时,本发明所述的系统错误信息侦测系统及方法能够通过BMC芯片来准确快速地找出系统故障的原因,其操作简便高效,增强了服务器自身的查错能力,以便尽快完成服务器的系统故障修复。这种方法不仅适用于服务器开发的工作人员,而且同样适用于使用服务器的普通用户。

【专利附图】

【附图说明】
[0008]图1是本发明服务器的系统错误信息侦测系统较佳实施例的运行环境示意图。
[0009]图2是本发明服务器的系统错误信息侦测方法较佳实施例的流程图。
[0010]图3是存储在BMC芯片的存储器中的错误对照关系表的不意图。
[0011]主要元件符号说明
[0012]服务器I
[0013]BMC 芯片10
[0014]系统错误信息侦测系统100
[0015]设置模块111
[0016]侦测模块112
[0017]解析模块113
[0018]B1S 芯片11
[0019]LPC 总线12
[0020]存储器110
[0021]微处理器120
[0022]远程监控设备2
[0023]网络3

【具体实施方式】
[0024]参阅图1所示,是本发明系统错误信息侦测系统100较佳实施例的运行环境示意图。在本实施例中,所述的系统错误信息侦测系统100安装并运行于服务器I中,该服务器I还包括,但不仅限于,基板管理控制器(Baseboard Management Controller,BMC芯片)10以及B1S芯片11。该BMC芯片10和B1S芯片11通过LPC (Low Pin Count)总线12相互连接。该BMC芯片10包括,但不仅限于,存储器110以及微处理器120。该服务器I通过网络3与远程监控设备2相连接。所述的远程监控设备2可以为一种个人计算机(PC)、工作站计算机(Workstat1n computer)或者其他电子装置。该远程监控设备2用于用户输入侦测服务器I的系统运行发生错误时的侦测指令,以及显示服务器I发生的系统错误信息。所述的网络3可以为一种国际互联网(Internet)或者企业局域网(Intranet)。
[0025]在本实施例中,所述的存储器110为一种内置于BMC芯片10中的Flash存储器或者EEPROM存储器,用于存储侦测服务器I的错误对照关系表以及系统侦测文件。该错误对照表定义了服务器I发生故障时的系统错误码与系统错误信息的对照关系。该系统侦测文件用于存储服务器I正常启动时从服务器I获取的系统启动信息,在服务器I发生故障时,侦测服务器I发生故障的系统错误信息。所述的微处理器120是一种微控制器或其他具备数据处理能力的处理芯片。
[0026]在本实施例中,所述的系统错误信息侦测系统100包括设置模块111、侦测模块112以及解析模块113。本发明所称的功能模块是指一种能够被微处理器120所执行并且能够完成固定功能的一系列程序指令段,其存储在存储器110中。关于各功能模块111-113将在图2的流程图中作具体描述。
[0027]参阅图2所示,是本发明服务器的系统错误信息侦测方法较佳实施例的流程图。在本实施例中,当服务器I在启动过程中发生故障时,该方法可以通过BMC芯片10来准确快速地找出服务器I的系统故障原因,其操作简便高效,增强了服务器I自身的查错能力。
[0028]步骤S21,设置模块111定义一个系统错误码与系统错误信息的错误对照关系表,并将该错误对照关系表保存在BMC芯片10的存储器110中。参考图3所示,是一个存储在存储器110中的错误对照关系表的示意图。该错误对照表定义了服务器I发生故障时的系统错误码与系统错误信息的对照关系,例如定义了 CPU错误、内存错误、硬盘错误、显卡错误及声卡错误的系统错误码,其分别为:EC00001、EC00002、EC00003、EC00004及EC00005
坐寸ο
[0029]步骤S22,设置模块111开启BMC芯片10与B1S芯片11之间的LPC总线12,并在B1S芯片11中设置一个用于获取服务器I的系统启动信息的主板端口。在本实施例中,该主板端口设置为第80号端口(例如Port:80),用于当服务器I正常启动时,BMC芯片10透过该端口获取服务器I的系统启动信息。
[0030]步骤S23,当服务器I正常启动时,侦测模块112通过LPC总线12从所述主板端口中实时获取服务器I的系统启动信息,并将系统启动信息保存在存储器110的系统侦测文件(Sensor file)中。在本实施例中,所述的系统侦测文件由BMC芯片10建立,并存储在BMC芯片10的存储器110中。当服务器I正常启动时,该系统侦测文件用于保存从服务器I获取的系统启动信息;当服务器I发生故障时,该系统侦测文件用于侦测服务器I发生故障的系统错误信息。
[0031]步骤S24,当服务器发生故障时,侦测模块112利用系统侦测文件从BMC芯片10中的错误对照关系表中获取系统错误码。在本实施例中,侦测模块112判断所述系统侦测文件中的系统启动信息是否被正常记录,当服务器I的硬件设备(例如内存)的启动信息没有被正常记录到系统侦测文件中,侦测模块112即从所述错误对照关系表中获取该硬件设备的系统错误码(例如EC00002)。
[0032]步骤S25,解析模块113根据BMC芯片10中的错误对照关系表解析出获取的系统错误码对应的系统错误信息。参考如图3所示,假如获取的系统错误码为EC00002,则解析模块113根据该错误对照关系表解析出的系统错误信息为内存(Memory)错误。
[0033]步骤S26,解析模块113将系统错误信息记录在服务器I的系统日志表中,并将该系统错误信息通过网络3显示在远程监控设备2上。当得到服务器I的系统错误信息后,解析模块113将通过网络浏览器(Web GUI)的形式直观将服务器I的系统错误信息显示在远程监控设备2上,同时也会以系统日志表(SEL)的形式将错误类型记录下来,方便用户后续通过多种不同的途径来产看服务器I的系统故障原因。此外,用户也可以通过IPMI命令来读取保存错误对照关系表中的系统错误码来获取服务器I的系统故障原因。
[0034]以上实施例仅用以说明本发明的技术方案而非限制,尽管参照以上较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换都不应脱离本发明技术方案的精神和范围。
【权利要求】
1.一种服务器的系统错误信息侦测系统,该服务器包括81(:芯片以及8103芯片,其特征在于,所述的系统错误信息侦测系统包括: 设置模块,用于定义一个系统错误码与系统错误信息的错误对照关系表,将该错误对照关系表保存在81(:芯片的存储器中,开启81(:芯片与8103芯片之间的总线,以及在8108芯片中设置一个用于获取服务器的系统启动信息的主板端口 ; 侦测模块,用于当服务器正常启动时,通过总线从所述主板端口中实时获取服务器的系统启动信息,并将系统启动信息保存在所述存储器的系统侦测文件中,当服务器发生故障时,利用所述系统侦测文件从保存在所述错误对照关系表中获取系统错误码;以及 解析模块,用于根据81(:芯片中的错误对照关系表解析出获取的系统错误码对应的系统错误信息,以及将系统错误信息记录在服务器的系统日志表中。
2.如权利要求1所述的系统错误信息侦测系统,其特征在于,所述的解析模块还用于将服务器的系统错误信息通过网络显示在远程监控设备上。
3.如权利要求1所述的系统错误信息侦测系统,其特征在于,所述的系统侦测文件由810芯片建立,并存储在8此芯片的存储器中。
4.如权利要求1所述的系统错误信息侦测系统,其特征在于,当服务器正常启动时,所述的系统侦测文件用于保存从服务器获取的系统启动信息,当服务器发生故障时,所述的系统侦测文件用于侦测服务器发生故障的系统错误信息。
5.如权利要求1所述的系统错误信息侦测系统,其特征在于,所述的从错误对照关系表中获取系统错误码的步骤包括: 判断所述系统侦测文件中的系统启动信息是否被正常记录;以及 当服务器的硬件设备的系统启动信息没有被正常记录到系统侦测文件中时,从所述错误对照关系表中获取该硬件设备对应的系统错误码。
6.一种服务器的系统错误信息侦测方法,该服务器包括81(:芯片以及8103芯片,其特征在于,该方法包括步骤: 定义一个系统错误码与系统错误信息的错误对照关系表,并将该错误对照关系表保存在81(:芯片的存储器中; 开启81(:芯片与8103芯片之间的总线,并在8103芯片中设置一个用于获取服务器的系统启动信息的主板端口; 当服务器正常启动时,通过总线从所述主板端口中实时获取服务器的系统启动信息,并将系统启动信息保存在所述存储器的系统侦测文件中; 当服务器发生故障时,利用所述系统侦测文件从保存在所述错误对照关系表中获取系统错误码;以及 根据81(:芯片中的错误对照关系表解析出获取的系统错误码对应的系统错误信息,以及将系统错误信息记录在服务器的系统日志表中。
7.如权利要求6所述的系统错误信息侦测方法,其特征在于,该方法还包括步骤:将服务器的系统错误信息通过网络显示在远程监控设备上。
8.如权利要求6所述的系统错误信息侦测方法,其特征在于,所述的系统侦测文件由810芯片建立,并存储在8此芯片的存储器中。
9.如权利要求6所述的系统错误信息侦测方法,其特征在于,当服务器正常启动时,所述的系统侦测文件用于保存从服务器获取的系统启动信息,当服务器发生故障时,所述的系统侦测文件用于侦测服务器发生故障的系统错误信息。
10.如权利要求6所述的系统错误信息侦测方法,其特征在于,所述的从错误对照关系表中获取系统错误码的步骤包括: 判断所述系统侦测文件中的系统启动信息是否被正常记录;以及当服务器的硬件设备的系统启动信息没有被正常记录到系统侦测文件中时,从所述错误对照关系表中获取该硬件设备对应的系统错误码。
【文档编号】G06F11/34GK104424084SQ201310381583
【公开日】2015年3月18日 申请日期:2013年8月27日 优先权日:2013年8月27日
【发明者】马淞, 张文杰 申请人:鸿富锦精密电子(天津)有限公司, 鸿海精密工业股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1