一种服务器板级错误检测及报警方法与流程

文档序号:31793413发布日期:2022-10-14 16:34阅读:48来源:国知局
一种服务器板级错误检测及报警方法与流程

1.本发明涉及服务器技术领域,尤其涉及一种服务器板级错误检测及报警方法。


背景技术:

2.服务器的应用越来越广泛,对于服务器的运维管理有了更高的要求,目前一般通过基板管理控制器(baseboard management controller,bmc)监测服务器的cpu温度、负载等运行状态信息,进行远程展示,以使管理员对服务器进行监控运维管理。
3.但是,bmc不控制服务器的上电过程,无法监测服务器的板级异常,例如服务器无法开机、服务器外设上电异常等问题。因此,目前对于服务器的板级异常监测,主要通过bmc监控服务器工作状态,如远程开机后,长时间服务器未正常工作,则可笼统地认为此服务器工作异常。
4.现有技术中存在着无法远程实时、准确地监测服务器的板级异常错误问题,导致服务器运维管理难度较大的技术问题。


技术实现要素:

5.本技术的目的是提供一种服务器板级错误检测及报警方法,用以针对解决现有技术中存在的无法远程实时、准确地监测服务器的板级异常错误问题,导致服务器运维管理难度较大的技术问题。
6.鉴于上述问题,本技术提供了一种服务器板级错误检测及报警方法。
7.第一方面,本技术提供了一种服务器板级错误检测及报警方法,所述方法应用于一种服务器板级错误检测及报警装置,所述装置包括服务器,和设置于所述服务器内的cpld模块和bmc模块,所述cpld模块和bmc模块通信连接;所述方法包括:通过所述cpld模块监测所述服务器的预设信息,获得监测信息,其中,所述预设信息为板级运行信息;根据所述监测信息,更新状态寄存器;通过所述bmc模块轮询所述状态寄存器,获得板级状态更新信息;根据所述板级状态更新信息,更新远程的状态查询界面,进行展示。
8.第二方面,本技术还提供了一种服务器板级错误检测及报警装置,所述装置包括:服务器;bmc模块,设置于所述服务器内,用于监测所述服务器的运行信息,获得监测信息;cpld模块,设置于所述服务器内,用于监测所述服务器的预设信息,所述预设信息为板级运行信息,所述cpld模块与所述bmc模块通过i2c接口通信连接;其中,所述cpld模块根据所述监测信息,更新状态寄存器,所述bmc模块轮询所述状态寄存器,获得板级状态更新信息,并根据所述板级状态更新信息,更新远程的状态查询界面,进行展示。
9.第三方面,本技术还提供了一种服务器板级错误检测及报警系统,用于执行如第一方面所述的一种服务器板级错误检测及报警方法,其中,所述系统包括:板级信息监测模块,用于通过cpld模块监测服务器的预设信息,获得监测信息,其中,所述预设信息为板级运行信息;状态寄存器更新模块,用于根据所述监测信息,更新状态寄存器;更新信息获取模块,用于通过bmc模块轮询所述状态寄存器,获得板级状态更新信息;状态更新展示模块,
用于根据所述板级状态更新信息,更新远程的状态查询界面,进行展示。
10.本技术中提供的一个或多个技术方案,至少具有如下技术效果或优点:
11.本技术提供的技术方案通过使bmc模块和cpld模块通信连接,cpld模块控制和监控服务器的板级运行信息,获得监测信息,更新服务器内的状态寄存器,bmc与cpld模块通信连接,轮询该状态寄存器,获得服务器的板级状态更新信息,更新远程的状态查询界面,对服务器是否出现板级问题进行展示。本技术通过通信连接bmc模块和cpld模块,使得bmc模块能够轮询cpld的状态寄存器,获知服务器的板级运行状态信息,进行远程更新展示,使得管理员可远程监测获取服务器是否出现板级运行错误,便于分析故障原因和快速维修,达到提升服务器的运维管理质量的技术效果,并且整体实现没有增加硬件成本,基于现有服务器内硬件实现了更为全面的错误检测和报警。
12.上述说明仅是本技术技术方案的概述,为了能够更清楚了解本技术的技术手段,而可依照说明书的内容予以实施,并且为了让本技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本技术的具体实施方式。
附图说明
13.为了更清楚地说明本技术或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是示例性的,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
14.图1为本技术实施例提供的一种服务器板级错误检测及报警方法的流程示意图;
15.图2为本技术实施例提供的一种服务器板级错误检测及报警方法中获得板级状态更新信息的流程示意图;
16.图3为本技术实施例提供的一种服务器板级错误检测及报警装置的结构示意图;
17.图4为本技术一种服务器板级错误检测及报警系统的结构示意图;
18.附图标记说明:板级信息监测模块11,状态寄存器更新模块12,更新信息获取模块13,状态更新展示模块14。
具体实施方式
19.本技术通过提供一种服务器板级错误检测及报警方法,用以针对解决现有技术中存在的无法远程实时、准确地监测服务器的板级异常错误问题,导致服务器运维管理难度较大的技术问题。
20.下面,将参考附图对本技术中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本技术的一部分实施例,而不是本技术的全部实施例,应理解,本技术不受这里描述的示例实施例的限制。基于本技术的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。另外还需要说明的是,为了便于描述,附图中仅示出了与本技术相关的部分而非全部。
21.实施例一
22.如图1所示,本技术提供了一种服务器板级错误检测及报警方法,其中,所述方法应用于一种服务器板级错误检测及报警装置,该装置包括服务器,和设置于服务器内的
cpld模块和bmc模块,cpld模块和bmc模块通信连接。
23.该方法包括:
24.s100:通过所述cpld模块监测所述服务器的预设信息,获得监测信息,其中,所述预设信息为板级运行信息;
25.本技术实施例中,该服务器内,bmc模块监测cpu温度、风扇转速、cpu负载等信息,并进行对服务器的远程监控和维护。而服务器的上电控制、各个外设的电源控制和各个外设的power good信号等板级运行信息都是由cpld模块来实现控制和监控的。因此,bmc无法获取服务器的板级运行信息,也无法远程监控板级问题是否出现。
26.所以,本技术实施例中,通过通信连接cpld模块和bmc模块,通过cpld模块监测服务器的预设信息,获得监测信息,该预设信息即为服务器的板级运行信息。
27.其中,该板级运行信息包括:服务器的主板电源状态信息,和服务器的外设电源状态信息。例如包括上述内容中的服务器的上电控制信息、以及各个外设的电源控制信息等。
28.优选地,cpld模块和bmc模块通过i2c接口通信连接,以提升bmc模块内软件实现的便利性。
29.s200:根据所述监测信息,更新状态寄存器;
30.具体地,根据该检测信息,更新cpld模块中的状态寄存器,以完成在cpld模块内进行的服务器板级运行状态的监测。
31.其中,该状态寄存器包括服务器主板的主板状态寄存器和服务器外设的外设状态寄存器。本技术实施例提供的方法中的步骤s200包括:
32.s210:根据所述监测信息,获得所述主板电源状态信息和外设电源状态信息;
33.s220:根据所述主板电源状态信息,更新所述主板状态寄存器;
34.s230:根据所述外设电源状态信息,更新所述外设状态寄存器。
35.具体地,cpld根据该监测信息获得其中的主板电源状态信息和外设电源状态信息。根据该主板电源状态信息,更新主板状态寄存器,根据该外设电源状态信息,更新该外设状态寄存器。
36.如此,主板状态寄存器和外设状态寄存器内分别存储有服务器的主板和外设的电源状态信息,在本地可通过访问主板状态寄存器和外设状态寄存器,判断服务器主板和外设是否上电正常,是否出现板级问题。本技术实施例中,为实现远程监测服务器的板级运行信息,继续后续步骤。
37.s300:通过所述bmc模块轮询所述状态寄存器,获得板级状态更新信息;
38.如图2所示,本技术实施例提供的方法中的步骤s300包括:
39.s310:通过所述bmc模块轮询所述主板状态寄存器,获得主板状态码;
40.s320:通过所述bmc模块轮询所述外设状态寄存器,获得外设状态码;
41.s330:将所述主板状态码和所述外设状态码作为所述板级状态更新信息。
42.具体地,通过与cpld模块通信连接的bmc模块,轮询cpld模块内的状态寄存器。
43.通过bmc模块轮询cpld模块内的主板状态寄存器,获得反映当前服务器主板电源运行状态的主板状态码。通过bmc模块轮询cpld模块内的外设状态寄存器,获得反映当前服务器外设电源运行状态的外设状态码。
44.如此,基于bmc模块内的软件设计,获得了cpld模块检测获得的服务器的板级运行
状态信息,将该主板状态码和外设状态码作为板级状态更新信息。
45.s400:根据所述板级状态更新信息,更新远程的状态查询界面,进行展示。
46.具体地,bmc模块通过该板级状态更新信息内的主板状态码和外设状态码,根据主板状态码,更新远程的状态查询界面,向管理员展示服务器的主板是否出现板级运行问题,以及,根据该外设状态码,更新远程的状态查询界面,向管理员展示服务器的外设是否出现板级运行问题,在出现板级运行问题时,可基于bmc模块内的软件设计,进行报警,提醒管理员进行服务器的维护。
47.其中,由于根据主板状态码和外设状态码,更新远程的状态查询界面,管理员可根据状态查询界面准确快速地定位服务器主板和软件的板级错误问题,便于快速地分析故障原因和维修,而非现有技术中的仅了解出现了故障,而无法了解板级故障的类型。
48.综上所述,本技术所提供的一种服务器板级错误检测及报警方法具有如下技术效果:
49.本技术通过通信连接bmc模块和cpld模块,使得bmc模块能够轮询cpld的状态寄存器,获知服务器的板级运行状态信息,进行远程更新展示,使得管理员可远程监测获取服务器是否出现板级运行错误,便于分析故障原因和快速维修,达到提升服务器的运维管理质量的技术效果,并且整体实现没有增加硬件成本,基于现有服务器内硬件实现了更为全面的错误检测和报警。
50.实施例二
51.基于与前述实施例中一种服务器板级错误检测及报警方法同样的发明构思,本技术还提供了一种服务器板级错误检测及报警装置,该装置内可执行实施例一所提供方法的全部步骤,实施例一内方法的描述在该装置中也同样适用。如图3所示,该装置包括:
52.服务器;
53.bmc模块,设置于所述服务器内,用于监测所述服务器的运行信息,获得监测信息;
54.cpld模块,设置于所述服务器内,用于监测所述服务器的预设信息,所述预设信息为板级运行信息,所述cpld模块与所述bmc模块通过i2c接口通信连接;
55.其中,所述cpld模块根据所述监测信息,更新状态寄存器,所述bmc模块轮询所述状态寄存器,获得板级状态更新信息,并根据所述板级状态更新信息,更新远程的状态查询界面,进行展示。
56.其中,所述板级运行信息包括:所述服务器的主板电源状态信息,和所述服务器的外设电源状态信息。
57.其中,所述状态寄存器包括主板状态寄存器和外设状态寄存器,根据所述监测信息,更新状态寄存器,包括:
58.根据所述监测信息,获得所述主板电源状态信息和外设电源状态信息;
59.根据所述主板电源状态信息,更新所述主板状态寄存器;
60.根据所述外设电源状态信息,更新所述外设状态寄存器。
61.其中,通过所述bmc模块轮询所述状态寄存器,获得板级状态更新信息,包括:
62.通过所述bmc模块轮询所述主板状态寄存器,获得主板状态码;
63.通过所述bmc模块轮询所述外设状态寄存器,获得外设状态码;
64.将所述主板状态码和所述外设状态码作为所述板级状态更新信息。
65.其中,根据所述板级状态更新信息,更新远程的状态查询界面,包括:
66.所述bmc模块根据所述主板状态码,更新所述远程的状态查询界面,向管理员展示;
67.所述bmc模块根据所述外设状态码,更新所述远程的状态查询界面,向管理员展示。
68.其中,所述cpld模块和bmc模块通过i2c接口通信连接。
69.实施例三
70.基于与前述实施例中一种服务器板级错误检测及报警方法同样的发明构思,如图4所示,本技术还提供了一种服务器板级错误检测及报警系统,所述系统包括:
71.板级信息监测模块11,用于通过cpld模块监测服务器的预设信息,获得监测信息,其中,所述预设信息为板级运行信息;
72.状态寄存器更新模块12,用于根据所述监测信息,更新状态寄存器;
73.更新信息获取模块13,用于通过bmc模块轮询所述状态寄存器,获得板级状态更新信息;
74.状态更新展示模块14,用于根据所述板级状态更新信息,更新远程的状态查询界面,进行展示。
75.其中,所述板级运行信息包括:所述服务器的主板电源状态信息,和所述服务器的外设电源状态信息。
76.进一步地,所述状态寄存器包括主板状态寄存器和外设状态寄存器,所述状态寄存器更新模块12还用于:
77.根据所述监测信息,获得所述主板电源状态信息和外设电源状态信息;
78.根据所述主板电源状态信息,更新所述主板状态寄存器;
79.根据所述外设电源状态信息,更新所述外设状态寄存器。
80.进一步地,所述更新信息获取模块13还用于:
81.通过所述bmc模块轮询所述主板状态寄存器,获得主板状态码;
82.通过所述bmc模块轮询所述外设状态寄存器,获得外设状态码;
83.将所述主板状态码和所述外设状态码作为所述板级状态更新信息。
84.进一步地,所述状态更新展示模块14还用于:
85.所述bmc模块根据所述主板状态码,更新所述远程的状态查询界面,向管理员展示;
86.所述bmc模块根据所述外设状态码,更新所述远程的状态查询界面,向管理员展示。
87.其中,所述cpld模块和bmc模块通过i2c接口通信连接。
88.本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,前述图1实施例一中的一种服务器板级错误检测及报警方法和具体实例同样适用于本实施例的一种服务器板级错误检测及报警系统,通过前述对一种服务器板级错误检测及报警方法的详细描述,本领域技术人员可以清楚的知道本实施例中一种服务器板级错误检测及报警系统,所以为了说明书的简洁,在此不再详述。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分
说明即可。
89.对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本技术。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本技术的精神或范围的情况下,在其它实施例中实现。因此,本技术将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1