备援方法及备援系统与流程

文档序号:20016982发布日期:2020-02-25 10:43阅读:751来源:国知局
备援方法及备援系统与流程

本发明是有关于一种备援方法及备援系统,特别是指一种实时通知与转换的备援方法及备援系统。



背景技术:

习知具有备援功能的服务器系统包含一个背板(backplane;bp)、多个主板(mainboard;mb)、多个设置在该背板上的多个发光二极管(led)、及多个系统芯片(soc)。该等发光二极管的灯号显示例如是对应多个磁碟机的运作状态,且该等主板为两两相对应的主板,也就是说该两两相对的其中一个主板上所设置的系统芯片与其对应的另一个主板上设置有相同的系统芯片,例如是基板管理控制器(baseboardmanagementcontroller;bmc)、芯片组、或是sas扩展器(expander)的控制器(controller)等等。当服务器系统开机正常运作后,设置在该两两相对应的主板的其中一者的系统芯片会操作在一个主控模式(mastermode),而设置在其中另一者的系统芯片会操作在一个从属模式(slavemode)。

此时,分别设置于该两两相对应的主板上的该二个系统芯片会透过预设的协定(protocol),协调由其中操作在该主控模式者,负责控制设置在背板上的该等发光二极管是否发光。当操作在该主控模式的系统芯片发生运作异常或故障时,习知的作法是同样透过该预设的协定将具有发生运作异常或故障的系统芯片的主板所对应的另一主板上原本操作在该从属模式的该系统芯片的操作模式切换为操作在该主控模式,同时将设置在背板上的该等发光二极管的控制权转为由原本操作在该从属模式的系统芯片来控制。然而,由于发生运作异常或故障的系统芯片因故障而无法控制其所在的主板的操作模式,如此却可能导致该发生运作异常或故障的系统芯片所在的主板仍操作于该主控模式而没有切换至操作于从属模式,进而造成更多的元件运作异常,或是使该具有备援功能的服务器系统被误判为具有两个操作于该主控模式的主板,而成为一个待解决的问题。



技术实现要素:

本发明要解决的技术问题是在于提供一种实时通知与转换的备援方法及备援系统。

为解决上述技术问题,本发明提供一种备援系统,其适用于二个第一发光二极管,并包含二个主板、二个逻辑运算单元、及二个控制单元。

该二个主板分别提供该二个第一发光二极管设置。该二个逻辑运算单元分别设置在该二个主板上,且分别电连接该二个第一发光二极管,以分别控制该二个第一发光二极管是否发光。

该二个控制单元分别设置在该二个主板上,并分别电连接该二个逻辑运算单元。其中,每一个控制单元执行一个韧体,使得该二个控制单元的其中一者操作在一个主控模式且其中另一者操作在一个从属模式。

当操作在该主控模式的该控制单元执行该韧体时,产生一个健康信号。该逻辑运算单元接收来自操作在该主控模式的该控制单元的该健康信号,并据以判断该控制单元为运作正常及运作异常的其中一者。

当该逻辑运算单元判断操作在该主控模式的该控制单元运作异常时,该逻辑运算单元控制对应的该第一发光二极管发光,且通知操作在该从属模式的该控制单元改为操作在该主控模式。

优选地,还适用于电连接该二个逻辑运算单元的多个第二发光二极管。其中,当对应的该逻辑运算单元判断操作在该主控模式的该控制单元运作正常时,该逻辑运算单元还接受对应的该控制单元的控制,以驱动该等第二发光二极管发光。

对应的该逻辑运算单元判断操作在该主控模式的该控制单元运作异常时,该逻辑运算单元还会不驱动该等第二发光二极管发光,由操作在该从属模式改为操作在该主控模式的该控制单元控制对应的该逻辑运算单元,以驱动该等第二发光二极管发光。

优选地,由操作在该从属模式改为主控模式的该控制单元还藉由网际网络传送一个通知信息,且储存相关于原本操作在该主控模式的该控制单元的一个异常纪录。

优选地,该控制单元运作正常时,该健康信号是一种具有一逻辑值的周期性信号,且在每一个周期中,该逻辑值会有预定变化。

优选地,该健康信号是一个周期性的脉冲信号。当该逻辑运算单元在每一个预定时间区间之内,判断所接收的该健康信号的逻辑值符合该预定变化时,则判定对应的该控制单元运作正常。而当该逻辑运算单元在某一个该预定时间区间之内,判断到该健康信号的逻辑值不符合该预定变化时,则判定对应的该控制单元运作异常。该预定时间区间大于等于该健康信号的周期。

为解决上述技术问题,本发明还提供一种备援方法,适用于二个第一发光二极管、二个逻辑运算单元、及二个控制单元。该二个逻辑运算单元分别电连接对应的该二个控制单元及对应的该二个第一发光二极管。该备援方法包含步骤(a)~(d)。

于步骤(a),藉由每一个控制单元执行一个韧体,使得该二个控制单元的其中一者操作在一个主控模式且其中另一者操作在一个从属模式。

于步骤(b),当操作在该主控模式的该控制单元执行该韧体时,产生一个健康信号。

于步骤(c),藉由对应的该逻辑运算单元接收来自操作在该主控模式的该控制单元的该健康信号,并据以判断该控制单元为运作正常及运作异常的其中一者。

于步骤(d),当对应的该逻辑运算单元判断操作在该主控模式的该控制单元运作异常时,该逻辑运算单元控制对应的该第一发光二极管发光,且通知操作在该从属模式的该控制单元改为操作在该主控模式。

优选地,还适用于电连接该二个逻辑运算单元的多个第二发光二极管。该备援方法还包含步骤(e),当对应的该逻辑运算单元判断操作在该主控模式的该控制单元运作正常时,该逻辑运算单元还接受对应的该控制单元的控制,以驱动该等第二发光二极管发光。

优选地,在步骤(d)中,该逻辑运算单元还会不驱动该等第二发光二极管发光,由操作在该从属模式改为操作在该主控模式的该控制单元控制对应的该逻辑运算单元,以驱动该等第二发光二极管发光。

优选地,在步骤(d)中,由操作在该从属模式改为主控模式的该控制单元还藉由网际网络传送一个通知信息,且储存相关于原本操作在该主控模式的该控制单元的一个异常纪录。

优选地,在步骤(b)中,该控制单元运作正常时,该健康信号是一种具有一逻辑值的周期性信号,且在每一个周期中,该逻辑值会有预定变化。

优选地,在步骤(b)中,该健康信号是一个周期性的脉冲信号。在步骤(c)中,当该逻辑运算单元在每一个预定时间区间之内,判断所接收的该健康信号的逻辑值符合该预定变化时,则判定对应的该控制单元运作正常。而当该逻辑运算单元在某一个该预定时间区间之内,判断到该健康信号的逻辑值不符合该预定变化时,则判定对应的该控制单元运作异常,该预定时间区间大于等于该健康信号的周期。

相较于现有技术,本发明备援方法及备援系统,藉由对应的该逻辑运算单元根据该健康信号,判断操作在该主控模式的该控制单元是否运作异常。当该控制单元的运作发生异常时,对应的该逻辑运算单元能够控制对应的该第一发光二极管发光,以指示对应发生异常的主板位置,且更重要的是能够实时通知另一个控制单元改为操作在该主控模式,以实时地启动备援机制。再者,对应的该逻辑运算单元同时不驱动该等第二发光二极管发光,使得另一个逻辑运算单元受控制而能驱动该等第二发光二极管发光以正确地显示磁碟机的运作状态。

【附图说明】

图1为一方块图,说明本发明备援系统的一个实施例。

图2为一流程图,说明本发明备援方法的多个步骤。

【具体实施方式】

请参阅图1所示,本发明备援系统的一个实施例,适用于二个第一发光二极管81、82、一个背板6及一个设置在该背板6上的发光二极管单元9,并包含二个主板71、72、二个逻辑运算单元21、22、及二个控制单元11、12。

更具体的说,一个具有备援功能的服务器系统包含一个磁碟储存单元(图未示)、一个背板6、多个第一发光二极管81、82、设置于该背板6上的该发光二极管单元9、及该备援系统。该等第一发光二极管81、82的数量与该等主板71、72的数量相同,且分别设置在该等主板71、72上或该等主板71、72所在的机壳(图未示)上,以指示对应的该控制单元11、12是否运作异常。该发光二极管单元9包括多个第二发光二极管91~98,以对应显示该磁碟储存单元所具有的多个磁碟机的运作状态,例如,每二个第二发光二极管对应一台磁碟机的运作状态,但不在此限。

该二个逻辑运算单元21、22分别设置在该二个主板71、72上,且分别电连接该二个第一发光二极管81、82,以分别控制该二个第一发光二极管81、82是否发光。该每一逻辑运算单元21、22还电连接该发光二极管单元9的该每一第二发光二极管91~98,并驱动该等第二发光二极管91~98发光,其中该逻辑运算单元21、22是受控制而驱动该等第二发光二极管91~98发光。

该二个控制单元11、12分别设置在该二个主板71、72上,并分别电连接该二个逻辑运算单元21、22,且具备分别控制该二个逻辑运算单元21、22以驱动该等第二发光二极管91~98是否发光的能力。

该二个控制单元11、12例如都是基板管理控制器、中央处理器(cpu)、南桥芯片、芯片组、系统单晶片或都是sas扩展器的控制器。其中,由于该发光二极管单元9所包括的多个第二发光二极管是用来指示对应的磁碟机的运作状态,因此,该多个第二发光二极管的数量也会因为近年来服务器系统的磁碟储存单元所包括的磁碟机数量增加而增加,同时,也因此对控制单元的输出入脚位的数量的需求也就更高。然而,基板管理控制器的输出入脚位受到一定数量的限制,芯片组的输出入脚位也受到一定数量的限制,sas扩展器的控制器也因为需要符合高速信号的传输要求,如pcie协定,而同样具有输出入脚位数量的限制。该二个逻辑运算单元21、22例如是复杂可程序逻辑装置(complexprogrammablelogicdevice;cpld),透过对应的该逻辑运算单元21、22,该控制单元11、12即可在有限的输出入脚位数量的情况下,相较于使用该控制单元11、12的输出入脚位直接控制该发光二极管单元9,而能控制数量更多的该等第二发光二极管91~98发光。

另外要补充说明的是:在本实施例中,该服务器系统的该备援系统所包含的主板71、72的数量是二个,而在其他实施例中,该备援系统也可以是包含二个以上的多个主板,而该等主板呈两两相对,分别运作在该主控模式及该从属模式。此外,该每一控制单元11、12是接收同样设置在相同主板71、72的一个中央处理器的一个控制信号,并据以控制或传送至对应的该逻辑运算单元21、22以驱动该等第二发光二极管91~98发光。也就是说,该等第二发光二极管91~98要如何发光以显示正确的灯号是由同样操作在该主控模式(即在同一张主板上)的该中央处理器来决定。

请参阅图2所示,该备援系统实施一个备援方法,并包含步骤s1~s5。

于步骤s1,每一控制单元11、12执行一韧体,使得该二控制单元11、12的其中一者操作在一主控模式且其中另一者操作在一从属模式。举例来说,该控制单元11操作在该主控模式,而该控制单元12操作在该从属模式,以下并同样以该例子说明,但不以此为限。

于步骤s2,当操作在该主控模式的该控制单元11执行该韧体时,产生一个健康信号。当该控制单元运作正常时,该健康信号是一种具有一逻辑值的周期性信号,且在每一个周期中,该逻辑值会有预定变化。在本实施例中,该健康信号是一个周期性的脉冲信号(pulse),其周期例如是1秒,但不在此限。

于步骤s3,藉由对应的该逻辑运算单元21接收来自操作在该主控模式的该控制单元11的该健康信号,并据以判断该控制单元11是否运作正常。

以下举例说明该逻辑运算单元21如何根据该健康信号判断该控制单元11是否运作正常。第一种态样,当该逻辑运算单元21在每一个预定时间区间之内,判断所接收的该健康信号的逻辑值符合该预定变化时,则判定对应的该控制单元11运作正常。而当该逻辑运算单元21在某一个该预定时间区间之内,判断到该健康信号的逻辑值不符合该预定变化时,则判定对应的该控制单元11为相异于运作正常的处于运作异常。该预定时间区间大于等于该健康信号的周期,该预定时间区间例如是1.5秒,即大于周期的1秒。

第二种态样,该健康信号是一种周期性信号,也是一种触发信号。当该逻辑运算单元21接收到该健康信号在每个周期中的逻辑变化时,则该逻辑运算单元21对其所包括的一个暂存器(图未示)写入一个预定的数值。该逻辑运算单元21在每一个预定时间区间之内,判断在该暂存器有读取到该预定的数值,则判定对应的该控制单元11运作正常,并进而将另一个数值写入该暂存器。而当该逻辑运算单元21在某一个该预定时间区间之内,判断在该暂存器都读取到相异于该预设的数值时,则判定对应的该控制单元11运作异常。

第三种态样,该健康信号是一种周期性信号,也是一种触发信号。当该逻辑运算单元21接收到该健康信号在每个周期中的逻辑变化时,则该逻辑运算单元21对其所包括的一个计时器(timer)的数值累加(或累减)一次。该逻辑运算单元21在每一个预定时间区间之内,判断该计时器的数值与前一次所读取的数值有变化,则判定对应的该控制单元11运作正常。而当该逻辑运算单元21在某一个该预定时间区间之内,判断该计时器的数值与前一次所读取的数值没有变化时,则判定对应的该控制单元11运作异常。

于步骤s4,当对应的该逻辑运算单元21判断操作在该主控模式的该控制单元11运作正常时,该逻辑运算单元21还接受对应的该控制单元11的控制,以驱动该等第二发光二极管91~98发光。

于步骤s5,当对应的该逻辑运算单元21判断操作在该主控模式的该控制单元11运作异常时,该逻辑运算单元21控制对应的该第一发光二极管81发光,以指示出具有该发生运作异常或故障的该控制单元11所对应的该主板71,借以帮助维修人员较快或较简易的找出具有该发生运作异常或故障的该控制单元11所对应的该主板71的相关位置,且通知操作在该从属模式的该控制单元12改为操作在该主控模式,即启动备援的功能,以维持服务器系统的正常运作。

再者,该逻辑运算单元21还会不驱动该等第二发光二极管发光91~98,由操作在该从属模式改为操作在该主控模式的该控制单元12控制对应的该逻辑运算单元22,以驱动该等第二发光二极管91~98发光。

此外,由操作在该从属模式改为主控模式的该控制单元12还藉由网际网络传送一个通知信息,以通知一个系统管理者关于该控制单元11发生运作异常的事件,且储存相关于原本操作在该主控模式的该控制单元11也就是发生运作异常的该控制单元11的一个异常纪录(faillog)。

综上所述,藉由对应的该逻辑运算单元根据该健康信号,判断操作在该主控模式的该控制单元是否运作异常。当该控制单元的运作发生异常时,对应的该逻辑运算单元不但控制对应的该第一发光二极管发光,以指示对应发生异常的主板位置,更重要的是能够实时通知另一个控制单元改为操作在该主控模式,以实时地启动备援机制,且同时不驱动该等第二发光二极管发光,使得另一个逻辑运算单元受控制而能驱动该等第二发光二极管发光以正确地显示磁碟机的运作状态,故确实能达成本发明的目的。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1