服务器的硬件监控装置的制作方法

文档序号:12595869阅读:来源:国知局

技术特征:

1.一种服务器的硬件监控装置,其特征在于,包括:

第一获取模块,用于通过服务器的操作系统获取CPU的状态数据、内存的状态数据、硬盘的状态数据;

第二获取模块,用于通过BMC获取主板状态数据、风扇状态数据、电源状态数据、和温度状态数据;以及

处理及报警模块,连接于所述第一获取模块和所述第二获取模块,用于根据需要对所述CPU的状态数据、内存的状态数据、硬盘的状态数据、主板状态数据、风扇状态数据、电源状态数据、和温度状态数据进行监控,还用于当其中的任意一种超出相应的设定阈值时判断对应的硬件出现故障并进行报警。

2.根据权利要求1所述的服务器的硬件监控装置,其特征在于,所述第一获取模块包括:

CPU及内存数据获取单元,用于通过MCE机制获取CPU的状态数据和内存的状态数据。

3.根据权利要求2所述的服务器的硬件监控装置,其特征在于,所述CPU的状态数据包括TLB状态数据、Cache状态数据、和总线状态数据;

当所述TLB状态数据、所述Cache状态数据、和所述总线状态数据之中的任意一种发生故障时,所述处理及报警模块进行报警。

4.根据权利要求1所述的服务器的硬件监控装置,其特征在于,

所述第一获取模块包括硬盘数据获取单元;

其中,所述硬盘的状态数据包括SMART信息。

5.根据权利要求4所述的服务器的硬件监控装置,其特征在于,

所述硬盘包括RAID卡;以及

所述硬盘的状态数据包括RAID卡的芯片状态数据、RAID卡的缓存状态数据、RAID卡的温度状态数据、和RAID卡的链路状态数据;

其中,硬盘数据获取单元通过RAID卡工具获取所述RAID卡的芯片状态数据、所述RAID卡的缓存状态数据、所述RAID卡的温度状态数据、和所述RAID卡的链路状态数据。

6.根据权利要求5所述的服务器的硬件监控装置,其特征在于,所述RAID卡的链路状态数据包括Invalid DWORD count指标,当所述Invalid DWORD count指标在运行期间出现上涨时,所述处理及报警模块进行报警。

7.根据权利要求1所述的服务器的硬件监控装置,其特征在于,

所述温度状态数据包括:CPU温度数据、内存温度数据、服务器环境温度数据、服务器出风口温度数据、和BMC温度数据。

8.根据权利要求2所述的服务器的硬件监控装置,其特征在于,

所述内存的状态数据包括内存可修正错误发生的次数和内存不可修正错误发生的次数;

当所述内存不可修正错误发生的次数在1次以上时,所述处理及报警模块进行报警;

当24小时内所述内存可修正错误发生的次数在1次以上时,所述处理及报警模块进行报警。

9.根据权利要求5所述的服务器的硬件监控装置,其特征在于,

RAID卡的缓存状态数据包括缓存可修正错误发生的次数和缓存不可修正错误发生的次数;

当所述缓存不可修正错误发生的次数在1次以上时,所述处理及报警模块进行报警;

当24小时内所述所述缓存可修正错误发生的次数在1次以上时,所述处理及报警模块进行报警。

10.根据权利要求1-9任一项所述的服务器的硬件监控装置,其特征在于,所述服务器的操作系统为Linux操作系统。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1