服务器及其侦错方法与流程

文档序号:12595772阅读:399来源:国知局
服务器及其侦错方法与流程

本发明是有关于一种电子资料处理装置及方法,特别是指一种用于开机检测出现异常时的服务器及其侦错方法。



背景技术:

随着物联网、云端、大数据等技术的发展,对于服务器的稳定性与可靠性的要求越来越高,服务器为云端、物联网等高性能计算技术的硬件基础,也是以上行业快速发展的关键。现有的服务器使用多种元件,例如微处理器、存储器、主机板、硬件板卡(如显示卡、音效卡等)、风扇等散热装置,且随着服务器技术的发展,各种硬件板卡、设备等大多要求整合于主机板上,因此,当服务器在开机过程中出现启动失败、当机时,如何经由主机板的侦错检测来诊断问题,成为确保服务器正常运转的重要课题。

一般而言,服务器的主机板包括一南桥(south bridge),及一基本输入输出系统(BIOS),并且在进行开机过程的侦错检测时,会外接一80端口译码器(port 80 decoder),及一七段显示器,该南桥在开机过程中,透过低引脚数(Low Pin Count)界面输出一开机检测信号,该80端口译码器接收该南桥的开机检测信号,再译码成八位信号以控制该七段显示器显示对应的错误码,例如显示C6来表示动态随机存取存储器(DRAM)故障。

然而此做法缺点在于,使用者若需要维修检错,需打开服务器的机箱并将其它装置移除,外接该80端口译码器及该七段显示器,才可观测错误码;而且使用者无法一眼即可看出故障的地方,必须凭经验判断,或者查阅说明书才能明白错误码C6的相对文字含义,而且这也仅是对应最后一笔检测错误所显示的错误码。在没有网络的环境、甚至使用者手边根本没有该80端口译码器及该七段显示器时,使用者将缺乏其他管道得到侦错信息。



技术实现要素:

因此,本发明的目的在于提供一种侦错方法,适用于一服务器,且该服务器包括一主机板,该主机板具有一控制芯片组,及一电连接该控制芯片组的基板管理控制器,且该侦错方法包含一步骤(A)、一步骤(B)、一步骤(C)、一步骤(D),及一步骤(F)。

该步骤(A)是该基板管理控制器储存一错误对照表,且该错误对照表记录多个不同系统错误码与多个不同系统错误讯息,每一系统错误码对应一种系统错误讯息,各种不同系统错误讯息是相关于各种不同的服务器开机异常状况。

该步骤(B)是当该服务器开机异常时,该控制芯片组输出至少一系统错误码。

该步骤(C)是该基板管理控制器接收来自该控制芯片组的该至少一系统错误码。

该步骤(D)是该基板管理控制器依据该至少一系统错误码,从该错误对照表找出至少一所对应的该系统错误讯息。

该步骤(F)是该基板管理控制器判断是否接收来自该主机板外部的一讯息输出请求,以决定是否输出该至少一系统错误讯息。

本发明的功效在于:该基板管理控制器依所接收的该系统错误码,根据所储存的该错误对照表找出所对应的该系统错误讯息,并于接收该讯息输出请求时,输出该系统错误讯息,以便使用者快速、直接得知为何种错误。

【附图说明】

图1是一系统方块图,说明本发明服务器的实施例;

图2是一示意图,说明本发明服务器的一基板管理控制器和一基本输入输出单元所储存的一错误对照表;

图3是一系统方块图,说明本发明侦测方法的一第一实施例;

图4是一流程图,辅助图3说明该第一实施例;

图5是一系统方块图,说明本发明侦测方法的一第二实施例;

图6是一流程图,辅助图5说明该第二实施例;

图7是一系统方块图,说明本发明侦测方法的一第三实施例;及

图8是一流程图,辅助图7说明该第三实施例;

图9是一系统方块图,说明本发明侦测方法的一第四实施例;及

图10是一流程图,辅助图9说明该第四实施例。

【具体实施方式】

在本发明被详细描述之前,应当注意在以下的说明内容中,类似的元件是以相同的编号来表示。

参阅图1,本发明服务器1的一实施例,包含一主机板11、一储存装置12、一显示器13、一电子装置14,及一电子装置15。

该主机板11包括一控制芯片组111、一基板管理控制器(baseboard management controller)113、一基本输入输出单元(basic input/output system)114、一视讯图形转换界面115,及一RS232总线116。

该控制芯片组111具有一侦错端口1111,以于服务器1开机检测过程中发生开机异常时,输出至少一系统错误码。在本例中,该控制芯片组111以平台控制器中心(Platform Controller Hub)来实施,且该侦错端口1111例如为第80端口(port 80)、第81端口(port 81)等。

该基板管理控制器113包括一非挥发性存储器1131、一RS232缓冲器1132、一视讯图形转换模块1133,及一远端序列(serial-over-LAN)通讯模块1135。该基板管理控制器113储存一错误对照表110,该错误对照表110记录多个不同系统错误码与多个不同系统错误讯息,且该基板管理控制器113经由LPC总线电连接该控制芯片组111的侦错端口1111,以接收来自该控制芯片组111的至少一系统错误码,并根据该错误对照表110找出所对应的该至少一系统错误讯息,记录于该非挥发性存储器1131。有关该基板管理控制器113的详细流程,例如该RS232缓冲器1132、该视讯图形转换模块1133,及该远端序列通讯模块1135的执行细节,请容后再进一步说明。其中,该基板管理控制器113用于记录该系统错误讯息的非挥发性存储器1131可为该基板管理控制器113自身的非挥发性随机存取存储器(NVRAM),除此之外,该基板管理控制器113也能将该系统错误讯息,记录于例如安全数位卡(Secure digital memory card)等外接的记忆卡1134,两者皆能供储存多笔系统错误讯息。另外,该视讯图形转换模块1133例如为视讯图形阵列(VGA)模块,经由快捷外设互联标准(PCIE)总线电连接该控制芯片组111,该视讯图形转换模块1133用于输出该基板管理控制器113转换该至少一系统错误讯息而成的至少一显示信号。

配合参阅图2,在本实施例中,该错误对照表110是根据例如AMI基本输入输出单元制造厂商所发布的工业标准,来定义服务器1发生故障时,该系统错误码与该系统错误讯息的对应关系,且该错误对照表110中,每一系统错误码对应一种系统错误讯息,各种不同系统错误讯息是相关于各种不同的服务器开机异常状况,例如:系统错误码0xA1、0xA2、0xA3、0xA4、0xA5、0xA6、0xA7…等分别对应为存储器未安装(Memory not installed)、中央处理器型号无效或速度不支持(Invalid CPU type or speed)、中央处理器配置错误(CPU mismatch)、中央处理器初始化错误(CPU initialization error)、北桥初始化错误(North bridge initialization error)、南桥初始化错误(South bridge initialization error)、快闪存储器更新失败(Flash update is failed)等。

复参阅图1,该基本输入输出单元114储存该错误对照表110,而且该基本输入输出单元114经由序列周边界面(SPI)总线电连接该控制芯片组111的侦错端口1111,以接收该系统错误码,并根据该错误对照表110找出所对应的该至少一系统错误讯息。而且该基本输入输出单元114可转换该至少一系统错误讯息成至少一显示信号并输出。在本实施例中,该基本输入输出单元114所储存的该错误对照表110和该基板管理控制器113所储存的错误对照表110相同。

该视讯图形转换界面115电连接该基板管理控制器113的视讯图形转换模块1133,且能接收来自该基板管理控制器113的视讯图形转换模块1133所输出的该显示信号,或是接收来自该基本输入输出单元114经由该控制芯片组111所传送的该显示信号,并将之输出。

该RS232总线116电连接该基板管理控制器113的RS232缓冲器1132,其执行细节在后面详细说明。

该储存装置12经由USB/SATA总线电连接该控制芯片组111,且该储存装置12具有一讯息取得模块121,能发出一讯息输出请求,以经由该控制芯片组111来获取该基板管理控制器113所输出的该至少一系统错误讯息。该储存装置12可利用一U盘、一SATA硬盘或一固态硬盘(SSD)来实施。

该电子装置14透过网络连接该基板管理控制器113,且该电子装置14具有一讯息取得模块141,及一网络用户界面(Web UI)142。该电子装置14的讯息取得模块141能发出该讯息输出请求,以透过网络取得该基板管理控制器113所输出的该至少一系统错误讯息。该网络用户界面142即用于显示该系统错误讯息。在本例中,该电子装置14例如为桌上型计算机或笔记型计算机等。

该显示器13电连接该主机板11的视讯图形转换界面115,以接收该显示信号并予以显示。

该电子装置15具有一显示模块151、一能透过网络与该基板管理控制器113的远端序列通讯模块1135进行通讯的远端序列通讯界面152,及一电连接该主机板11的RS232总线116的控制台重导向模块(console redirection utility)153。在本例中,该电子装置15例如为桌上型计算机或笔记型计算机等。

参阅图3与图4,本发明侦错方法的一第一实施例于图3所示的该服务器1中实施。以下详细说明该第一实施例的各个步骤。

在步骤A中,该基板管理控制器113储存该错误对照表110。

在步骤B中,当该服务器1开机异常时,该控制芯片组111输出至少一系统错误码。

在步骤C中,该基板管理控制器113接收来自该控制芯片组111的该至少一系统错误码。

在步骤D中,该基板管理控制器113依据该至少一系统错误码,从该错误对照表110找出所对应的该至少一系统错误讯息。

在步骤E中,该基板管理控制器113将该至少一系统错误讯息记录于该非挥发性存储器1131。进一步说,该基板管理控制器113会记录多笔系统错误讯息于该非挥发性存储器1131,或/且记录多笔系统错误讯息于该记忆卡1134,以确保该服务器1发生掉电或当机时,所有发生过的系统错误皆能留存而供使用者得知。

在步骤F中,该基板管理控制器113判断是否接收来自该主机板11外部的一讯息输出请求,以决定是否输出该至少一系统错误讯息。详细来说,该步骤F包括以下子步骤。

于步骤F1,当该储存装置12的讯息取得模块121通过本地端使用者操作,而发出该讯息输出请求时,该讯息输出请求经由该控制芯片组111传送到该基板管理控制器113。在此说明的是,该讯息输出请求为一智慧平台管理界面(IPMI)指令。

于步骤F2,当该基板管理控制器113接收来自该储存装置12的该讯息输出请求时,即输出该至少一系统错误讯息,经由该控制芯片组111储存于该储存装置12,借此供本地端使用者快速、直接得知该服务器1在开机检测过程中所有发生过的系统错误。且于此说明的是,该基板管理控制器113是将该非挥发性存储器1131(或该记忆卡1134)中记录的所有系统错误讯息输出,因此本地端使用者能完整得知所有曾经发生过的系统错误状况。

参阅图5与图6,本发明侦错方法的一第二实施例于图5所示的该服务器1中实施。该第二实施例与该第一实施例的步骤A至步骤E相同,差别在于该步骤F,及该步骤F之后的步骤G至步骤J。其中,该步骤F包括以下子步骤。

于步骤F3,当该显示器13被使用者连接于该主机板11的视讯图形转换界面115时,发出一视讯图形转换信号作为该讯息输出请求,传送到该基板管理控制器113的视讯图形转换模块1133。

于步骤F4,当该基板管理控制器113的视讯图形转换模块1133经由该视讯图形转换界面115接收来自该显示器13的该讯息输出请求时,该基板管理控制器113的视讯图形转换模块1133将该至少一系统错误讯息转换成至少一显示信号,经由该主机板11的视讯图形转换界面115,输出于该显示器13。

在步骤G中,该基本输入输出单元114初始化该基板管理控制器113的视讯图形转换模块1133,且于初始化完成后,通知该基板管理控制器113,以使该基板管理控制器113停止输出该显示信号,由该基本输入输出单元114接管该视讯图形转换模块1133。

在步骤H中,该基本输入输出单元114接收来自该控制芯片组111的该至少一系统错误码,并根据该错误对照表110找出所对应的该至少一系统错误讯息。

在步骤I中,该基本输入输出单元114将该至少一系统错误讯息转换成至少一显示信号,经由该基板管理控制器113的视讯图形转换模块1133输出于该主机板11的视讯图形转换界面115,进而输出于该显示器13。如此一来,即便没有网络、该储存装置12时,使用者也能通过检视该显示器13得知开机检测过程中所出现的系统错误。

参阅图7与图8,本发明侦错方法的一第三实施例于图7所示的该服务器1中实施。该第三实施例与该第一实施例的步骤A至步骤E相同,差别在于该步骤F,且该步骤F包括以下子步骤。

于步骤F5,当该电子装置14的讯息取得模块141通过远端使用者操作,而发出该讯息输出请求时,该讯息输出请求经由网络传送到该基板管理控制器113。在此说明的是,该讯息输出请求为一智慧平台管理界面(IPMI)指令。

于步骤F6,当该基板管理控制器113接收来自该电子装置14的讯息输出请求时,即将该至少一系统错误讯息,经由网络输出于该电子装置14的网络用户界面142。如此,即便在高密度的服务器机房,服务器1的数量庞大时,使用者也能直接透过该电子装置14的网络用户界面142,快速得知为哪些服务器1的主机板11于开机检测过程中出现错误,并能直接辨识出该系统错误讯息为何种错误。

参阅图9与图10,本发明侦错方法的一第四实施例于图9所示的该服务器1中实施。该第四实施例与该第一实施例的步骤A至步骤E相同,差别在于该步骤F,且该步骤F包括以下子步骤。

于步骤F7,该电子装置15能通过使用者操作而发出该讯息输出请求,传送到该基板管理控制器,其中,该讯息输出请求包括一控制台重导向(console redirection)指令及一远端序列(serial-over-LAN)通讯指令的其中之一。详细来说,本地端使用者能通过操作该电子装置15的控制台重导向模块153,而发出该控制台重导向指令,经由该主机板11的RS232总线116至该基板管理控制器113;远端使用者能通过操作该电子装置15的远端序列通讯界面152,透过网络发出该远端序列通讯指令到该基板管理控制器113。

于步骤F8,当该基板管理控制器113将该至少一系统错误讯息转换成至少一RS232讯息,储存于该RS232缓冲器1132,并于接收来自该电子装置15的讯息输出请求时,即将该至少一RS232讯息,从该RS232缓冲器1132经由该RS232总线116输出于该电子装置15。更详细来说,对于本地端使用者而言,该RS232讯息能经由该RS232总线116输出于该电子装置15的控制台重导向模块153。另外,该RS232讯息也能经由该基板管理控制器113的远端序列通讯模块1135,透过网络输出于该电子装置15的远端序列通讯界面152,并透过该显示模块151显示使使用者得知。如此,不论使用者所在环境是否有网络,或是身处服务器机房或远端,皆能快速、直接得知为哪些服务器1的主机板11于开机检测过程中出现错误,而能增加使用者于维修侦错时的弹性。

综上所述,通过本发明服务器及其侦错方法,当使用者手边没有例如80端口译码器、七段显示器来显示侦错时,使用者可根据身处的环境有没有网络,配合利用该储存装置12、该显示器13、该电子装置14、该电子装置15与该基板管理控制器113沟通,不仅能快速、直接地获取具体的系统错误讯息,而且增加使用者侦错的管道与在不同环境应用的弹性。此外,通过该非挥发性存储器1131或是该记忆卡1134来记录多笔系统错误讯息,更能让使用者完整得知曾经发生过的所有系统错误状况,所以确实能达成本发明的目的。

上面结合附图对本发明的具体实施方式和实施例做了详细说明,但不能以之限定本发明的范围,在本发明申请专利范围内所作的修饰和变化,皆应该属于本发明专利范围内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1