监控方法、装置、设备和存储介质与流程

文档序号:35462731发布日期:2023-09-16 01:33阅读:181来源:国知局
监控方法、装置、设备和存储介质与流程

本申请涉及数据监控,特别是涉及一种监控方法、装置、设备和存储介质。


背景技术:

1、随着经济社会的高速发展,我国即将迎来互联网+时代,互联网+时代的来临伴随着服务器产业的迅速崛起,海量数据正以前所未有的增长趋势冲击着各个行业,服务器凭借其优良的性能广泛应用于云计算、大数据处理、网络平台等领域,受到市场的青睐。而bmc(baseboardmanagementcontroller,基板管理控制器)属于独立于服务器系统的一个用于管理和控制的子系统,可以对服务器内各设备进行监控,即可实现对故障状态下pcieswtich(pcie扩展设备)内相关寄存器的监控、故障分析、故障定位以及故障上报等功能。

2、pcieswtich可以提供扩展或聚合能力,允许更多的其他设备通过pcie总线连接到一个pcie端口。pcie(pci-express,总线)是一种通用的总线规格,它由intel所提倡和推广,其目的是取代现有电脑系统内部的总线传输接口,不仅包括显示接口,还囊括了cpu、pci、hdd、network等多种应用接口。

3、目前,在基于bmc实现对pcieswtich中寄存器的监控时,主要是通过i2c(inter-integratedcircuit,串行通信总线)直接和pcieswtich连接,使得bmc可以直接访问pcieswtich中的寄存器,以根据寄存器的内容读取监控数据。

4、然而,由于pcieswtich自身一直处于工作状态,在工作过程中会对寄存器进行控制,而bmc在监控过程中读取寄存器的数据时也会对寄存器进行操作,从而导致对寄存器的访问存在冲突,使得pcieswtich工作不稳定,进而影响服务器的整体工作运行状态。


技术实现思路

1、基于此,本申请提供了一种监控方法、装置、设备和存储介质,以确保bmc能够稳定安全的访问pcie扩展设备,且不与pcie扩展设备内部发生冲突,进而达到提高服务器的整体运行稳定性的效果。

2、第一方面,提供一种监控方法,该方法包括:

3、根据预设周期对多个pcie扩展设备进行轮询监控;

4、调用扫描函数对各pcie扩展设备进行扫描操作,得到扫描信息;扫描信息包括pcie扩展设备扫描数量;

5、将pcie扩展设备扫描数量与基板管理控制器中pcie扩展设备安装数量进行比对;

6、在扫描数量等于安装数量时,获取各pcie扩展设备的监控数据,以及根据监控数据确定各pcie扩展设备的工作状态。

7、根据本申请实施例中一种可实现的方式,扫描信息还包括各pcie扩展设备的物理地址;在扫描数量等于安装数量时,获取各pcie扩展设备的监控数据,包括:

8、在扫描数量等于安装数量时,将各pcie扩展设备的物理地址与基板管理控制器中各pcie扩展设备的硬件地址进行比对;

9、在各pcie扩展设备的物理地址与各pcie扩展设备的硬件地址均对应相同时,获取各pcie扩展设备的监控数据。

10、根据本申请实施例中一种可实现的方式,该方法还包括:

11、在其中任意一个或多个pcie扩展设备的物理地址与各pcie扩展设备的硬件地址均不同时,退出对与各pcie扩展设备的硬件地址均不同的pcie扩展设备的监控操作。

12、根据本申请实施例中一种可实现的方式,该方法还包括:

13、在扫描数量小于安装数量时,将扫描到的各pcie扩展设备的物理地址与各pcie扩展设备的硬件地址进行比对,得到比对结果;

14、根据比对结果确定未被扫描到的pcie扩展设备,将未被扫描到的pcie扩展设备的监控数据设置为异常值,以及获取被扫描到的pcie扩展设备的监控数据。

15、根据本申请实施例中一种可实现的方式,获取各pcie扩展设备的监控数据,以及根据监控数据确定各pcie扩展设备的工作状态,包括:

16、在各pcie扩展设备的监控数据均获取成功时,将各监控数据进行记录,并根据记录的监控数据确定各pcie扩展设备的工作状态;

17、在其中任意一个或多个pcie扩展设备的监控数据获取失败时,将获取失败的pcie扩展设备的监控数据设置为异常值。

18、根据本申请实施例中一种可实现的方式,调用扫描函数对各pcie扩展设备进行扫描操作的步骤之前,还包括:

19、确定当前监控服务器是否处于上电状态;

20、若处于上电状态,则调用扫描函数对各述pcie扩展设备进行扫描操作;

21、若处于未上电状态,则退出当前监控操作,以及将各pcie扩展设备的监控数据均设置为异常值。

22、根据本申请实施例中一种可实现的方式,监控数据包括温度数据、版本号数据、端口数数据、各端口链路状态数据、各端口类型数据、各端口速率数据、各端口宽度数据、各端口异常状态数据以及pcie扩展设备异常计数数据中的任意一个或多个。

23、第二方面,提供了一种监控装置,该装置包括:

24、监控模块,用于根据预设周期对多个pcie扩展设备进行轮询监控;

25、扫描模块,用于调用扫描函数对各pcie扩展设备进行扫描操作,得到扫描信息;扫描信息包括pcie扩展设备扫描数量;

26、比对模块,用于将pcie扩展设备扫描数量与基板管理控制器中pcie扩展设备安装数量进行比对;

27、确定模块,用于在扫描数量等于安装数量时,获取各pcie扩展设备的监控数据,以及根据监控数据确定各pcie扩展设备的工作状态。

28、第三方面,提供了一种计算机设备,包括:

29、至少一个处理器;以及

30、与至少一个处理器通信连接的存储器;其中,

31、存储器存储有可被至少一个处理器执行的计算机指令,计算机指令被至少一个处理器执行,以使至少一个处理器能够执行上述第一方面中涉及的方法。

32、第四方面,提供了一种计算机可读存储介质,其上存储有计算机指令,其特征在于,计算机指令用于使计算机执行上述第一方面中涉及的方法。

33、根据本申请实施例所提供的技术内容,根据预设周期对多个pcie扩展设备进行轮询监控;调用扫描函数对各pcie扩展设备进行扫描操作,得到扫描信息;扫描信息包括pcie扩展设备扫描数量;将pcie扩展设备扫描数量与基板管理控制器中pcie扩展设备安装数量进行比对;在扫描数量等于安装数量时,获取各pcie扩展设备的监控数据,以及根据监控数据确定各pcie扩展设备的工作状态。上述操作,基于得到的扫描信息,获取各pcie扩展设备的监控数据,以确保bmc能够稳定安全的访问pcie扩展设备,且不与pcie扩展设备内部发生冲突,进而达到提高服务器的整体运行稳定性的效果。



技术特征:

1.一种监控方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述扫描信息还包括各所述pcie扩展设备的物理地址;所述在所述扫描数量等于所述安装数量时,获取各所述pcie扩展设备的监控数据,包括:

3.根据权利要求2所述的方法,其特征在于,所述方法还包括:

4.根据权利要求2所述的方法,其特征在于,所述方法还包括:

5.根据权利要求1所述的方法,其特征在于,所述获取各所述pcie扩展设备的监控数据,以及根据所述监控数据确定各所述pcie扩展设备的工作状态,包括:

6.根据权利要求1所述的方法,其特征在于,所述调用扫描函数对各所述pcie扩展设备进行扫描操作的步骤之前,还包括:

7.根据权利要求1-6任意一项所述的方法,所述监控数据包括温度数据、版本号数据、端口数数据、各端口链路状态数据、各端口类型数据、各端口速率数据、各端口宽度数据、各端口异常状态数据以及pcie扩展设备异常计数数据中的任意一个或多个。

8.一种监控装置,其特征在于,所述装置包括:

9.一种计算机设备,包括:

10.一种计算机可读存储介质,其上存储有计算机指令,其特征在于,所述计算机指令用于使计算机执行权利要求1至7中任一项所述的方法。


技术总结
本申请涉及一种监控方法、装置、设备和存储介质。主要技术方案包括:根据预设周期对多个PCIe扩展设备进行轮询监控;调用扫描函数对各PCIe扩展设备进行扫描操作,得到扫描信息;扫描信息包括PCIe扩展设备扫描数量;将PCIe扩展设备扫描数量与基板管理控制器中PCIe扩展设备安装数量进行比对;在扫描数量等于安装数量时,获取各PCIe扩展设备的监控数据,以及根据监控数据确定各PCIe扩展设备的工作状态。本申请基于得到的扫描信息,获取各PCIe扩展设备的监控数据,以确保BMC能够稳定安全的访问PCIe扩展设备,且不与PCIe扩展设备内部发生冲突,达到提高服务器的整体运行稳定性的效果。

技术研发人员:胡秀珍
受保护的技术使用者:苏州浪潮智能科技有限公司
技术研发日:
技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1