一种BMC芯片智能协处理装置及处理方法与流程

文档序号:12863078阅读:423来源:国知局
一种BMC芯片智能协处理装置及处理方法与流程

本发明涉及bmc芯片领域,具体涉及一种bmc芯片智能协处理装置及处理方法。



背景技术:

随着客户对服务器的稳定性方面的要求原来越高,对服务器主板的管理要求越来越严格。服务器主板采用bmc芯片进行管理,bmc芯片可以实现系统运行的监测及控制,从而实现对系统更好的维护。在服务器的实际应用中,bmc芯片会受到各种因素的干扰,比如电磁辐射、电压不稳等,会造成bmc芯片的程序跑飞。当bmc芯片失效之后,服务器的运行和监控失去控制,整个服务器有工作异常的风险。同时,bmc芯片失效也就无法发送报警信息,即使客户发现问题也需要耗费人力去现场维护,带来极大的资源浪费。



技术实现要素:

为解决上述问题,本发明提供一种bmc芯片智能协处理装置及处理方法,可在bmc芯片内部处理器失效后,维持视频及控制的传输,并发送警报到管理平台,实时传送服务器工作状态,并根据配置策略决定是否关闭服务器。

本发明的技术方案是:一种bmc芯片智能协处理装置,包括:arm处理器,通信模块,与所述arm处理器连接的协处理模块,分别与所述arm处理器、协处理模块连接的服务器主板,以及通过通信模块与协处理模块连接的管理平台;

所述协处理模块包括:

看门狗子模块:对arm处理器进行失效检测并复位arm处理器,且将arm处理器失效信息和复位信息发送给协处理控制子模块;

协处理控制子模块:设置有主板信息接收端口和主板控制信号发出端口;当arm处理器正常运行时,将arm处理器发出的交互信息经通信模块转发给管理平台,将arm处理器发出的主板控制信号经主板控制信号发出端口转发给服务器主板,并将经通信模块接收的控制信息发送给arm处理器;当接收到arm处理器失效信息时,将经主板信息接收端口接收的主板信息由通信模块发给管理平台,并由主板控制信号发出端口发出主板控制信号给服务器主板,且由通信模块发出警报信息给管理平台。

进一步地,所述协处理控制子模块包括:

警报接收单元:接收看门口模块发出的arm处理器失效信息;

警报判断单元:根据arm处理器失效信息判断警报级别;

警报发送单元:将警报信息以报文形式发出。

进一步地,警报发送单元发出的警报信息报文包括以下信息:警报类型、目的编号、设备请求编号、本次arm处理器失效时间、上次arm处理器失效时间、24小时失效次数、历史失效次数、溢出标志、ecc校验数据。

进一步地,主板信息接收端口为视频信息接收端口,主板控制信号发出端口为主板电源控制信号发出端口。

进一步地,arm处理器发出的交互信息包括视频信息。

进一步地,通信模块为网络接口。

进一步地,协处理模块还包括数据封装解析子模块,所述数据封装解析子模块用于对arm处理器与协处理控制子模块之间的传输数据进行封装或解析。

一种bmc芯片智能协处理方法,包括arm处理器、协处理模块和服务器主板;

还包括以下步骤:

s1:协处理模块转发arm处理器发出的交互信息和主板控制信号,并判断arm处理器是否失效;

s2:若arm处理器未失效则重复步骤s1,若arm处理器失效则协处理模块接管交互信息和主板控制信号,并发出警报信息,且重启arm处理器。

进一步地,步骤s2中协处理模块接管交互信息是指协处理模块接收主板信息并将其发出,且发出主板电源控制信号给服务器主板。

进一步地,步骤s2中发出警报信息具体包括以下步骤:

s2.1:判断失效间隔是否小于最短间隔预设阈值;

s2.2:若失效间隔小于最短间隔预设阈值,则发出三级警报并关闭服务器;否则判断失效间隔是否小于中级间隔预设阈值;

s2.3:若失效间隔小于中级间隔预设阈值,则发出二级警报;否则判断失效间隔是否小于最长间隔预设阈值;

s2.4:若失效间隔小于最长时间预设阈值,则发出一级警报。

本发明提供的bmc芯片智能协处理装置及处理方法,在bmc芯片内部处理器失效后,维持视频及控制的传输,并发送警报到管理平台,实时传送服务器工作状态,起到监视服务器运行的作用。同时,本装置具有记录bmc芯片处理器失效间隔的功能,根据失效间隔的时间决定发送警报级别,以及决定是否关闭服务器,确保服务器不出现事故。

附图说明

图1是本发明具体实施例装置结构示意图。

图2是本发明具体实施例方法流程示意图。

图中,1-arm处理器,2-协处理模块,21-看门狗子模块,22-数据封装解析子模块,23-协处理控制子模块,3-服务器主板,4-通信模块,5-管理平台。

具体实施方式

下面结合附图并通过具体实施例对本发明进行详细阐述,以下实施例是对本发明的解释,而本发明并不局限于以下实施方式。

如图1所示,本发明提供的bmc芯片智能协处理装置,包括:arm处理器1、通信模块4、协处理模块2、服务器主板3、管理平台5。协处理模块2与arm处理器1连接,服务器主板3分别与arm处理器1、协处理模块2连接,管理平台5通过通信模块4与协处理器连接。

其中协处理模块2包括:看门狗子模块21和协处理控制子模块23。

看门狗子模块21:对arm处理器1进行失效检测并复位arm处理器1,且将arm处理器1失效信息和复位信息发送给协处理控制子模块23。

协处理控制子模块23:设置有主板信息接收端口和主板控制信号发出端口;当arm处理器1正常运行时,将arm处理器1发出的交互信息经通信模块4转发给管理平台5,将arm处理器1发出的主板控制信号经主板控制信号发出端口转发给服务器主板3,并将经通信模块4接收的控制信息发送给arm处理器1;当接收到arm处理器1失效信息时,将经主板信息接收端口接收的主板信息由通信模块4发给管理平台5,并由主板控制信号发出端口发出主板控制信号给服务器主板3,且由通信模块4发出警报信息给管理平台5。

本实施例中,通信模块4可以采用网络接口,主板信息接收端口为视频信息接收端口,主板控制信号发出端口为主板电源控制信号发出端口,arm处理器1发出的交互信息包括视频信息。服务器主板3将视频信息(vga信号)发出后可经数模转换电路转换为数字信号后发送给arm处理器1或协处理控制子模块23。

协处理模块2还包括数据封装解析子模块22,数据封装解析子模块22用于对arm处理器1与协处理控制子模块23之间的传输数据进行封装或解析。

在arm处理器1正常运行时,协处理模块2将arm处理器1发出信息转发给管理平台5或服务器主板3;在arm处理器1失效期间,协处理模块2接管对服务器主板3的监控,即接收服务器主板3发出的视频信息,将其直接经网络发送给管理平台5,并发送主板电源控制信号给服务器主板3,从而起到监视服务器运行的作用。当arm处理器1复位并启动完毕后,再将控制权转交给arm处理器1。

协处理控制子模块23接收到arm处理器1失效信息后,还根据其内部配置策略判断警报级别,实现警报功能,供管理员及时发现故障。协处理控制子模块23配置有:

警报接收单元:接收看门口模块发出的arm处理器1失效信息;

警报判断单元:根据arm处理器1失效信息判断警报级别;

警报发送单元:将警报信息以报文形式发出。

协处理控制子模块23根据失效间隔时间判断警报级别,并决定是否关闭服务器。

当失效间隔小于最短间隔预设阈值(可设置为1小时),则发出三级警报,并关闭服务器;当失效间隔小于中间间隔预设阈值(可设置为12小时),则发出二级警报;当失效间隔小于最长间隔预设阈值(可设置为24小时),则发出三级警报。

警报发送单元发出的警报信息报文包括以下信息:警报类型、目的编号、设备请求编号、本次arm处理器失效时间、上次arm处理器失效时间、24小时失效次数、历史失效次数、溢出标志、ecc校验数据。管理平台5接收报文信息,可实时监控服务器失效状态。

如图2所示,本实施例提供的bmc芯片智能协处理方法,具体包括以下步骤:

s1:协处理模块2转发arm处理器1发出的交互信息和主板控制信号,并判断arm处理器1是否失效;

s2:若arm处理器1未失效则重复步骤s1,若arm处理器1失效则协处理模块2接管交互信息和主板控制信号,并发出警报信息,且重启arm处理器1。

步骤s2中协处理模块2接管交互信息是指协处理模块2接收主板信息并将其发出,且发出主板电源控制信号给服务器主板3。

步骤s2中发出警报信息具体包括以下步骤:

s2.1:判断失效间隔是否小于最短间隔预设阈值;

s2.2:若失效间隔小于最短间隔预设阈值,则发出三级警报并关闭服务器;否则判断失效间隔是否小于中级间隔预设阈值;

s2.3:若失效间隔小于中级间隔预设阈值,则发出二级警报;否则判断失效间隔是否小于最长间隔预设阈值;

s2.4:若失效间隔小于最长时间预设阈值,则发出一级警报。

以上公开的仅为本发明的优选实施方式,但本发明并非局限于此,任何本领域的技术人员能思之的没有创造性的变化,以及在不脱离本发明原理前提下所作的若干改进和润饰,都应落在本发明的保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1