一种服务器中管理控制器故障保护的方法及系统与流程

文档序号:12915814阅读:309来源:国知局
一种服务器中管理控制器故障保护的方法及系统与流程

本发明涉及一种服务器保护系统,属于计算机技术领域,尤其涉及一种服务器中管理控制器故障保护的方法及系统



背景技术:

服务器中的可编程控制器工作时,可能会发生功能异常、无法执行预定程序等问题。遇到这种情况,需要对可编程控制器进行复位。现有技术的处理方式如下所示:将可编程控制器的复位信号连接到看门狗watchdog电路或设备上,可编程控制器不断向watchdog电路发送脉冲信号,当可编程控制器出现故障时,程序无法执行脉冲信号无法发出。watchdog电路不断进行计时,并在收到脉冲信号后清零计时的值。当计时时间达到预设值时,由于脉冲信号没发出来,计时器没有及时清零导致计时时间到达预定值,watchdog电路向可编程控制器发出复位信号,保证可编程控制器正常工作。

在服务器设计中,经常会用到管理控制器对服务器的风扇、电压、功耗、错误信息等进行监控和控制。管理控制器也是上述可编程控制器的一种,为保证服务器可靠性,也需要在管理控制器出现故障的时候复位管理控制器。

管理控制器在上电启动的时候需要进行初始化,其初始化需要一段时间,一般在1分钟以上。如果采用上述现有技术对管理控制器进行监控和复位,其计时时间一定要超过管理控制器初始化需要的时间,否则会导致管理控制器在上电启动时,未完成初始化,就在watchdog电路控制下进行复位,因而无法启动的现象。而计时时间过长的缺点在于,在管理控制器出现故障的时候,需要等很长时间才能复位恢复正常工作。这会导致管理控制器在很长时间内无法监控服务器的重要信息,对服务器的可靠性来说是不利的。



技术实现要素:

本发明提供一种服务器中管理控制器故障保护的方法及系统,用以解决现有技术中管理控制器watchdog的计时时间过长,需要较长时间才能复位恢复正常工作,使管理控制器发生无法监控服务器的安全隐患。

本发明通过以下技术方案予以实现:

一种服务器中管理控制器故障保护的方法,包括以下步骤:

s1.将服务器的管理控制器调试串口信号输出端接到故障保护装置的信号输入端,故障保护装置的复位信号输出端连接管理控制器的复位信号输入端,用以通过故障保护装置控制管理控制器复位。

s2.当管理控制器出现故障进行初始化时,管理控制器通过调试串口信号输出端连续向故障保护装置发送当前的初始化状态信息,用于指示管理控制器初始化程度;当管理控制器初始化正常工作时,管理控制器会间隔通过调试串口信号输出端向故障保护装置发送指定的数据。

s3.故障保护装置根据管理控制器调试串口信号输出端发来的数据进行判断,当调试串口信号输出端发来的是管理控制器的初始化信息时,则不做处理;当调试串口信号输出端发来的是管理控制器间隔发送的指定的数据,则故障保护装置开始计时,并在下次收到相同的所述指定的数据时,将故障保护装置计时的值清零;当计时的值达到预设值时,故障保护装置未接收到管理控制器调试串口信号输出端发送的指定的数据,则发送复位信号将管理控制器复位。

如上所述的一种服务器中管理控制器故障保护的方法,所述步骤s3故障保护装置计时的预设值为20~40秒。

如上所述的一种服务器中管理控制器故障保护的方法,所述故障保护装置为复杂可编程逻辑器件cpld或现场可编程门阵列fpga。

如上所述的一种服务器中管理控制器故障保护的方法,所述故障保护装置为watchdog电路。

一种服务器中管理控制器故障保护的系统,包括服务器,所述服务器的管理控制器调试串口信号输出端接到故障保护装置的信号输入端,故障保护装置的复位信号输出端连接管理控制器的复位信号输入端,所述故障保护装置设置有比较模块和计时模块,所述比较模块用于对管理控制器调试串口信号输出端发来的数据进行判断,当调试串口信号输出端发来的是管理控制器的初始化信息时,则不做处理;当调试串口信号输出端发来的是管理控制器间隔发送的指定的数据,则将所述计时模块启动计时,并在下次收到所述指定的数据时,将计时模块计时的值清零;当计时的值达到预设值时,故障保护装置未接收到管理控制器调试串口信号输出端发送的指定的数据,则发送复位信号将管理控制器复位。

如上所述的一种服务器中管理控制器故障保护的系统,所述故障保护装置为复杂可编程逻辑器件cpld或现场可编程门阵列fpga。

如上所述的一种服务器中管理控制器故障保护的系统,所述计时模块计时的预设值为20~40秒。

与现有技术相比,本发明的优点是:

本发明针对现有技术中管理控制器watchdog的计时时间过长的缺点,采用管理控制器在初始化过程中和正常工作过程中向cpld/fpga发送不同的串口信息,cpld/fpga对该信息进行判断,并根据判断结果决定是否复位。通过本发明的方法及系统可以缩短管理控制器出现故障时,对其进行复位恢复所需要的时间;增加的管理控制器正常工作的时间,提升服务器的可靠性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍。

图1是本发明系统的电气原理图。

图2是本发明方法的流程图。

附图标记:1-管理控制器,2-串口数据线,3-复位数据线,4-故障保护装置,41-比较模块,42-计时模块。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。

如图1所示,本实施例一种服务器中管理控制器故障保护的系统,包括服务器,服务器的管理控制器1调试信号输出端通过串口数据线2与故障保护装置4的信号输入端连接,故障保护装置4的复位信号输出端通过复位数据线3与管理控制器的复位信号输入端连接,从而可以通过故障保护装置4对管理控制器1进行复位。

管理控制器4设置有比较模块41和计时模块42,比较模块41用于对管理控制器1调试串口发来的数据进行判断,当调试串口发来的是管理控制器1的初始化信息时,则不做处理;当调试串口发来的是管理控制器1初始化完成后间隔发送的指定数据,则将所述计时模块42启动计时,并在下次收到所述指定数据时,将计时模块42计时的值清零;当计时的值达到预设值时,故障保护装置4未接收到管理控制器发送的指定数据,则通过复位信号将管理控制器1复位。进一步的,计时模块42计时的预设值为30秒。

本发明还提供了一种服务器中管理控制器故障保护的方法,包括以下步骤:

首先将服务器的管理控制器1调试信号输出端接到故障保护装置4的信号输入端,故障保护装置4的复位信号输出端连接管理控制器1的复位信号输入端,用以通过故障保护装置4控制管理控制器1复位。

当管理控制器1出现故障进行初始化时,管理控制器1通过调试串口连续向故障保护装置4发送当前的初始化状态信息,用于指示管理控制器1初始化程度;当管理控制器1初始化正常工作时,管理控制器1会间隔通过调试串口向故障保护装置4发送指定的数据。

然后故障保护装置4通过管理控制器1调试串口发来的数据进行判断,当调试串口发来的是管理控制器1的初始化信息时,则不做处理;当调试串口发来的是管理控制器1初始化完成后间隔发送的指定数据,则故障保护装置4开始计时,并在下次收到相同的所述指定数据时,将故障保护装置4计时的值清零;当计时的值达到预设值时,故障保护装置4未接收到管理控制器发送的指定数据,则通过复位信号将管理控制器1复位。

其中故障保护装置4为复杂可编程逻辑器件cpld或现场可编程门阵列fpga,cpld/fpga中设置有比较模块和计时模块。

具体而言,如图2所示,本实施例在管理控制器1初始化时,通过调试串口不断发送当前的初始化状态信息,指示当前管理控制器1初始化到了哪一步;管理控制器完成初始化而正常工作时,每隔预定时间就通过调试串口向cpld/fpga发送指定的数据。

cpld/fpga根据调试串口的发来的数据进行判断,如调试串口发来的是管理控制器1的初始化信息,则不做处理;如果调试串口发来的是管理控制器1初始化完成后,定期发送的指定数据,则cpld/fpga开始计时,并在再次收到所述指定数据后,清零计时的值。当计时的值达到预设值时,通过复位信号复位管理控制器1。

通过本发明的方法及系统可以缩短管理控制器出现故障时,对其进行复位恢复所需要的时间;增加管理控制器1正常工作的时间,提升服务器的可靠性。

本发明未详尽描述的技术内容均为公知技术。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1