计算机系统及其操作方法

文档序号:6491308阅读:157来源:国知局
计算机系统及其操作方法
【专利摘要】一种计算机系统及其操作方法在此揭露。计算机系统包括至少一受监控装置以及逻辑控制装置。逻辑控制装置连接受监控装置,用以监控受监控装置的状态信号,以判断受监控装置是否处于错误状态。当受监控装置处于错误状态时,逻辑控制装置计时一预设时间,并在此预设时间后判断受监控装置是否恢复正常,且判断受监控装置是否在此预设时间内进行重置。若受监控装置未恢复正常且受监控装置未在此预设时间内进行重置,则逻辑控制装置重置受监控装置。
【专利说明】 计算机系统及其操作方法
【技术领域】
[0001]本发明是有关于一种电子系统及其操作方法,特别是有关于一种计算机系统及其操作方法。
【背景技术】
[0002]随着数字科技的发展,计算机系统已被广泛地应用在人们的生活当中,如用以提供个人使用的桌上型电脑、笔记型电脑及用以提供网络服务的网络处理器、服务器等。
[0003]一般而言,计算机系统包括多个分别运作的装置,如中央处理器、南桥芯片、储存装置、基本输入输出系统等。当这些装置发生错误时,其可通过传送错误信息至计算机系统中的管理控制器(如基板管理控制器),以令管理控制器重新启动这些装置。然而,管理控制器本身可能出错或失效,以至于在装置发生错误时管理控制器未能予以重启。如此一来,计算机系统可能长时间处于错误状态,若计算机系统为提供网络服务的服务器,则可能造成网络服务品质下降,并进一步造成使用者的不满。
[0004]是以,为确保计算机系统错误回复的可靠性,上述问题有急迫解决的需要。

【发明内容】

[0005]本发明的一方面为一种计算机系统,其利用一逻辑控制装置进行信号监控及错误回复。
[0006]根据本发明一实施例,计算机系统包括至少一受监控装置以及逻辑控制装置。逻辑控制装置连接受监控装置,用以监控受监控装置的状态信号,以判断受监控装置是否处于错误状态。当受监控装置处于错误状态时,逻辑控制装置计时一预设时间,并在此预设时间后判断受监控装置是否恢复正常,且判断受监控装置是否在此预设时间内进行重置。若受监控装置未恢复正常且受监控装置未在此预设时间内进行重置,则逻辑控制装置重置受监控装置。
[0007]根据本发明一实施例,逻辑控制装置还包括状态映射表,逻辑控制装置储存受监控装置的状态信号于状态映射表中的对应地址,作为正确运作数据。
[0008]根据本发明一实施例,逻辑控制装置比对受监控装置的状态信号与储存于状态映射表中相应地址的正确运作数据,以判断受监控装置是否处于错误状态。
[0009]根据本发明一实施例,逻辑控制装置还包括计时器,用以计时预设时间。
[0010]根据本发明一实施例,逻辑控制装置依据是否未接收到受监控装置所发出的正常信号,或依据受监控装置是否发出错误信号,以判断受监控装置是否处于错误状态。
[0011]根据本发明一实施例,逻辑控制装置重启主要电力轨(main power rail)以使该受监控装置重新开机。
[0012]本发明的一方面为一种计算机系统的操作方法。根据本发明一实施例,计算机系统包括逻辑控制装置以及至少一受监控装置,逻辑控制装置连接受监控装置,操作方法包括:监控受监控装置的状态信号;根据受监控装置的状态信号以判断受监控装置是否处于错误状态;当受监控装置处于错误状态时,计时一预设时间;在此预设时间后,判断受监控装置是否恢复正常,且判断受监控装置是否在此预设时间内进行重置;以及,若受监控装置未恢复正常且受监控装置未在此预设时间内进行重置,则重置受监控装置。
[0013]根据本发明一实施例,其中逻辑控制装置包括一状态映射表,且根据受监控装置的状态信号以判断受监控装置是否处于错误状态的步骤包括:储存受监控装置的状态信号于状态映射表中的对应地址以作为正确运作数据;而后,比对受监控装置的状态信号与储存于状态映射表中相应地址的正确运作数据,以判断受监控装置是否处于错误状态。
[0014]根据本发明一实施例,其中根据受监控装置的状态信号,以判断受监控装置是否处于错误状态的步骤包括:依据是否未侦测到受监控装置所发出正常信号,或依据受监控装置是否发出错误信号以判断受监控装置是否处于错误状态。
[0015]根据本发明一实施例,重置受监控装置的步骤包括:重启主要电力轨以使受监控装置重新开机。
[0016]综上所述,应用上述的实施例,当计算机系统的内部装置发生错误时,可通过逻辑控制装置进行回复,其中由于逻辑控制装置可用逻辑元件实现,较不易出错,是以能提供较可靠的错误回复机制。
【专利附图】

【附图说明】
[0017]图1为根据本发明一实施例所绘示的计算机系统的方块图;
[0018]图2为根据本发明一实施例所绘示的计算机系统的操作方法的流程图。
[0019]【主要元件符号说明】
[0020]100:计算机系统200:操作方法
[0021]110:逻辑控制装置 D1-D7:受监控装置
[0022]112:状态映射表S1-S6:步骤
[0023]114:计时器LPC、PCI_X:总线
【具体实施方式】
[0024]以下将以附图及详细叙述清楚说明本发明的精神,任何所属【技术领域】中具有通常知识者在了解本发明的较佳实施例后,当可由本发明所教示的技术,加以改变及修饰,其并不脱离本发明的精神与范围。
[0025]关于本文中所使用的“连接”,可指二或多个元件相互直接作实体或电性接触,或是相互间接作实体或电性接触,而“连接”还可指二或多个元件相互操作或动作。
[0026]本发明的一方面为一种计算机系统,其利用一逻辑控制装置进行信号监控及错误回复。计算机系统可为桌上型电脑、笔记型电脑、网络处理器以及服务器等,为使叙述清楚,在以下的段落中将以服务器为例进行说明。
[0027]图1为根据本发明一实施例所绘示的计算机系统100的方块图。计算机系统100包括至少一受监控装置(例如,7个受监控装置D1-D7)以及一逻辑控制装置110。当注意到,受监控装置可为计算机系统100中的内部装置,例如可为但不限于南桥芯片(southbridge chip)、基本输入输出系统(basic input outputsystem, BIOS)、基板管理控制器(baseboard management controller,BMC)、中央处理器(central processing unit,CPU)、电源供应单元(power supply unit, PSU)、储存装置或电压调节器(voltage regulatordown,VRD)中的任一者,而为使叙述清楚,在以下的段落中将以7个受监控装置D1-D7为例进行说明,其中Dl可为南桥芯片、D2可为基本输入输出系统、D3可为基板管理控制器、D4可为中央处理器、D5可为电源供应单元、D6可为储存装置,且D7可为电压调节器。逻辑控制装置110可用(但不限于)逻辑电路、可编程逻辑装置(programmable logic device,PLD)、复杂可编程逻辑装置(complex programmable logic device, CPLD)、或可编程逻辑门阵列(field programmable gate array, FPGA)所实现。
[0028]逻辑控制装置110分别连接受监控装置D1-D7,用以监控受监控装置D1-D7的状态信号,以判断受监控装置D1-D7是否处于错误状态。举例而言,逻辑控制装置110可通过低脚位(low pin count, LPC)总线监控南桥芯片Dl与基本输入输出系统D2是否发出正常信号(如heartbeat signal)、通过延伸周边元件互连总线(peripheral componentinterconnect extended,PC1-X)监控基板管理控制器D3是否发出正常信号(如heartbeatsignal)、通过通用输入输出(generalpurpose input/output, GP10)脚位监控中央处理器D4是否发出过热信号或错误信号(如CPU_ierr、CPU_mcerr、Thermal_trip)、电源供应单元D5是否发出过热信号及/或正常信号(如电源良好信号(如power good signal))、以及储存装置D6与电压调节器D7是否发出错误信号及/或正常信号(如电源错误信号(powerfault signal)及/或电源良好信号(power good signal))。其中,由于电压调节器D7可分别输出多个电压位准给计算机系统100中的内部装置,故逻辑控制装置110可分别监测电压调节器D7所输出的每个电压位准的错误信号及/或正常信号。如此一来,通过监控受监控装置D1-D7的错误信号及/或正常信号,逻辑控制装置110即可依据是否未侦测到受监控装置D1-D7所发出正常信号,或依据受监控装置D1-D7是否发出错误信号以判断受监控装置D1-D7是否处于错误状态。
[0029]而当受监控装置D1-D7处于错误状态时,逻辑控制装置110可计时一段预设时间,并在此段预设时间后判断受监控装置D1-D7是否恢复正常,例如是否再次接收到正常信号或错误信号消失,并判断受监控装置D1-D7是否在此段预设时间内进行重置。举例而言,逻辑控制装置110可利用多个通用输入输出接脚以分别监控电压调节器D7输出的多个电压位准或多个电压位准的电源正常信号,并对应这些电压位准是否重新启动(如,是否关闭后开启)以判断受监控装置D1-D7是否已进行重置。
[0030]接着,若受监控装置D1-D7未恢复正常且受监控装置D1-D7未在此段预设时间内进行重置,则逻辑控制装置110可重置受监控装置D1-D7。举例而言,逻辑控制装置110可通过发送重置信号至受监控装置D1-D7以重置单一受监控装置D1-D7,或重新启动主要电力轨(main power rail)以使计算机系统100重新开机。
[0031]通过上述的设置,逻辑控制装置110可监控受监控装置01_07的状态,以在受监控装置D1-D7在发生错误而未被恢复或被重置时,重新启动计算机系统100或单一发生错误的受监控装置D1-D7,而确保计算机系统100的正确运作。此外,由于逻辑控制装置110可用逻辑元件实现,是以相较于高阶的管理控制器(如基板管理控制器),逻辑控制装置110可提供更可靠的错误回复机制。
[0032]在本发明一实施例中,逻辑控制装置110可还包括一状态映射表112。在计算机系统100运作时,逻辑控制装置110可储存受监控装置D1-D7的状态信号于状态映射表112中的对应地址,作为正确运作数据。举例而言,由第一通用输入输出接脚接收的逻辑电位可储存于状态映射表112中的第一地址、由第二通用输入输出接脚接收的逻辑电位可储存于状态映射表112中的第二地址、且由LPC总线的第一接脚接收的逻辑电位可储存于状态映射表112中的第三地址。当注意到,在一些实施例中,状态映射表112中的每一地址可指向多个暂存器空间,以储存不同时间下的状态信号,或储存周期性的状态信号(如heartbeatsignal)。
[0033]在取得正确运作数据后,逻辑控制装置110可比对当下所接收的受监控装置D1-D7的状态信号与过去储存于状态映射表112中相应地址的正确运作数据,以判断受监控装置D1-D7是否处于错误状态。同样地,逻辑控制装置110亦可借此判断受监控装置D1-D7出错后是否恢复正常。举例而言,若储存于状态映射表112中第二地址的中央处理器D4的过热信号(如Thermaltrip)为高逻辑电位,则当逻辑控制装置110发现第二通用输入输出接脚所接收的中央处理器D4的过热信号为低逻辑电位时,逻辑控制装置110可依此判断中央处理器D4处于错误状态。
[0034]当注意的是,在其它实施例中,逻辑控制装置110亦可比对受监控装置01_07的状态信号以及管理者所预设的数值以判断受监控装置D1-D7是否处于错误状态,判断方式不以上述实施例为限。
[0035]在一些实施例中,逻辑控制装置110亦可根据受监控装置D1-D7中多个状态信号进行整体上的错误判断。
[0036]另外,在本发明一实施例中,逻辑控制装置110可还包括一计时器114,用以计时前述预设时间。
[0037]此外,熟悉本领域者当可明白,在不脱离本发明精神下,受监控装置D1-D7的状态信号可为任何可用以表示受监控装置D1-D7是否正常运作的信号,而不以前述实施例中的信号为限。
[0038]本发明另一方面为一种计算机系统的操作方法。此操作方法可用于结构与前述图1中相同或类似的计算机系统。为方便说明,下述操作方法系以图1所示的实施例为例进行描述,但并不以图1的实施例为限。
[0039]当注意到,在以下操作方法中的步骤中,除非另行述明,否则并不具有特定顺序。另外,以下步骤亦可能被同时执行,或者于执行时间上有所重叠。
[0040]图2为根据本发明一实施例中的操作方法200所绘示的流程图。操作方法200可包括步骤S1-S5。在计算机系统100启动后,监控受监控装置D1-D7的状态信号(步骤SI),并根据受监控装置D1-D7的状态信号以判断受监控装置D1-D7是否处于错误状态(步骤S2)。当受监控装置D1-D7处于错误状态时,开始计时一段预设时间(步骤S3),接着,进行计时(步骤S4)。在到达预设时间后,判断受监控装置D1-D7是否恢复正常,且判断受监控装置D1-D7是否在预设时间内进行重置(步骤S5),若受监控装置D1-D7未恢复正常且受监控装置D1-D7未在预设时间内进行重置,则重置受监控装置D1-D7 (步骤S6)。
[0041]其中,关于受监控装置D1-D7的详细说明可参照前一实施方式,在此不赘述。
[0042]以实施上的范例而言,在步骤SI中,计算机系统100可监控南桥芯片D1、基本输入输出系统D2与基板管理控制器D3是否发出正常信号(如heartbeatsignal)、中央处理器D4是否发出过热信号或错误信号,如CPU_ierr、CPU_mcerr、Thermal_trip,电源供应单元D5是否发出过热信号及/或正常信号,如电源良好信号(如power good signal),以及储存装置D6与电压调节器D7是否发出错误信号及/或正常信号,如电源错误信号(powerfault signal)及/或电源良好信号(power good signal)。其中,计算机系统100可分别监测电压调节器D7所输出的每个电压位准的错误信号及/或正常信号。
[0043]在步骤S2中,计算机系统100可依据是否未侦测到受监控装置D1-D7所发出正常信号,或依据受监控装置D1-D7是否发出错误信号以判断受监控装置D1-D7是否处于错误状态。另外,若受监控装置D1-D7并未处于错误状态,则计算机系统100重新执行步骤SI,以持续监控受监控装置D1-D7的状态信号。
[0044]在步骤S3中,计算机系统100可利用计时器开始计时。在一些实施例中,计算机系统100在此段时间中继续监控受监控装置D1-D7的状态信号,以判断是否还有其它错误,而进一步进行整体上的错误判断。
[0045]在步骤S5中,计算机系统100可通过是否再次接收到正常信号或错误信号消失,以判断受监控装置D1-D7是否恢复正常,并可分别监控电压调节器D7输出的多个电压位准或多个电压位准的电源正常信号,并对应这些电压位准是否重新启动(如,是否关闭后开启)以判断受监控装置D1-D7是否已进行重置。其中,若计算机系统100判断受监控装置D1-D7已恢复正常或已进行重置,则表示受监控装置D1-D7可能已由其它错误回复机制进行处理,故计算机系统100可重新执行步骤SI以再次监控受监控装置D1-D7的状态信号。
[0046]在步骤S6中,计算机系统100可通过发送重置信号至受监控装置D1-D7以重置单一受监控装置D1-D7,或重新启动主要电力轨(main power rail)以使计算机系统100中的受监控装置D1-D7重新开机。
[0047]通过上述的设置,计算机系统100可监控受监控装置D1-D7的状态,以在受监控装置D1-D7在发生错误而未被恢复或被重置时,重新启动受监控装置D1-D7或发生错误的受监控装置D1-D7,而确保计算机系统100的正确运作。
[0048]在本发明一实施例中,步骤S2可包括以下子步骤。(a)储存受监控装置D1-D7的状态信号于状态映射表112中的对应地址,作为正确运作数据;而后(b)比对受监控装置D1-D7的状态信号与储存于状态映射表112中相应地址的正确运作数据,以判断受监控装置D1-D7是否处于错误状态。
[0049]举例而言,计算机系统100可储存中央处理器D4的过热信号(如Thermal_trip)的逻辑电位于状态映射表112中的第二地址,作为计算机系统100正确运作数据,而后计算机系统100可通过比对接收到的中央处理器D4的过热信号与储存于状态映射表112中的第二地址的逻辑电位是否相同以判断中央处理器D4是否处于错误状态。
[0050]此外,在一些实施例中,计算机系统100同样可利用储存于状态映射表112中的正确运作数据以判断受监控装置D1-D7出错后是否恢复正常。
[0051]当注意的是,在其它实施例中,计算机系统100亦可比对受监控装置D1-D7的状态信号以及管理者所预设的数值以判断受监控装置D1-D7是否处于错误状态,故判断错误的方式不以上述实施例为限。
[0052]虽然本发明已以实施例揭露如上,然其并非用以限定本发明,任何熟悉此技艺者,在不脱离本发明的精神和范围内,当可作各种的更动与润饰,因此本发明的保护范围当视所附的权利要求书所界定的范围为准。
【权利要求】
1.一种计算机系统,其特征在于,包括: 至少一受监控装置;以及 一逻辑控制装置,连接该受监控装置,用以监控该受监控装置的状态信号,以判断该受监控装置是否处于错误状态,其中当该受监控装置处于错误状态时,该逻辑控制装置计时一预设时间,并在该预设时间后判断该受监控装置是否恢复正常,且判断该受监控装置是否在该预设时间内进行重置,其中若该受监控装置未恢复正常且该受监控装置未在该预设时间内进行重置,则该逻辑控制装置重置该受监控装置。
2.根据权利要求1所述的计算机系统,其特征在于,该逻辑控制装置还包括一状态映射表,该逻辑控制装置储存该受监控装置的状态信号于该状态映射表中的对应地址以作为正确运作数据。
3.根据权利要求2所述的计算机系统,其特征在于,该逻辑控制装置比对该受监控装置的状态信号与储存于该状态映射表中相应地址的正确运作数据,以判断该受监控装置是否处于错误状态。
4.根据权利要求1所述的计算机系统,其特征在于,该逻辑控制装置还包括一计时器,用以计时该预设时间。
5.根据权利要求1所述的计算机系统,其特征在于,该逻辑控制装置依据是否未接收到该受监控装置所发出的正常信号,或依据该受监控装置是否发出错误信号,以判断该受监控装置是否处于错误状态。
6.根据权利要求1所述的计算机系统,其特征在于,该逻辑控制装置重启主要电力轨以使该受监控装置重新开机。
7.一种计算机系统的操作方法,其特征在于,该计算机系统包括一逻辑控制装置以及至少一受监控装置,该逻辑控制装置连接该受监控装置,该操作方法包括: 监控该受监控装置的状态信号; 根据该受监控装置的状态信号以判断该受监控装置是否处于错误状态; 当该受监控装置处于错误状态时,计时一预设时间; 在该预设时间后,判断该受监控装置是否恢复正常,且判断该受监控装置是否在该预设时间内进行重置;以及 若该受监控装置未恢复正常且受监控装置未在该预设时间内进行重置,则重置该受监控装置。
8.根据权利要求7所述的操作方法,其特征在于,该逻辑控制装置包括一状态映射表,且根据该受监控装置的状态信号以判断该受监控装置是否处于错误状态的步骤包括: 储存该受监控装置的状态信号于该状态映射表中的对应地址以作为正确运作数据;而后 比对该受监控装置的状态信号与储存于该状态映射表中相应地址的正确运作数据,以判断该受监控装置是否处于错误状态。
9.根据权利要求7所述的操作方法,其特征在于,根据该受监控装置的状态信号,以判断该受监控装置是否处于错误状态的步骤包括: 依据是否未侦测到该受监控装置所发出正常信号,或依据该受监控装置是否发出错误信号以判断该受监控装置是否处于错误状态。
10.根据权利要求7所述的操作方法,其特征在于,重置该受监控装置的步骤包括:重启主要电力轨以 使该受监控装置重新开机。
【文档编号】G06F11/30GK103838656SQ201210470105
【公开日】2014年6月4日 申请日期:2012年11月20日 优先权日:2012年11月20日
【发明者】陈嘉祥 申请人:英业达科技有限公司, 英业达股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1