一种网络硬件运行风险监测预警系统的制作方法

文档序号:37264541发布日期:2024-03-12 20:47阅读:9来源:国知局
一种网络硬件运行风险监测预警系统的制作方法

本发明涉及网络硬件,具体涉及一种网络硬件运行风险监测预警系统。


背景技术:

1、网络设备可能出现的故障包括软件层面的业务故障和硬件层面的硬件故障,其中,服务器是网络硬件中的重要组成部分,主要提供计算服务等。由于服务器需要响应服务请求,并进行处理,因此一般来说服务器应具备承担服务并且保障服务的能力。根据服务器提供的服务类型不同,分为文件服务器,数据库服务器,应用程序服务器等。服务器的主要构成包括处理器、硬盘、内存、系统总线等,和通用的计算机架构类似。

2、在大数据时代,大量的it设备会集中放置在数据中心。这些数据中心包含各类型的服务器、存储、交换机及大量的机柜及其它基础设施。每种it设备都是有各种硬件板卡组成,如计算模块、存储模块、机箱、风扇模块等等。服务器机柜中通常密集地组装着服务器、交换机、存储装置等设备,这些设备消耗电力并产生热量,随着服务器性能的提高,其消耗的功率也越来越大,所以,服务器机柜内会形成非常集中的热负荷,这些热负荷产生的热量如果不及时驱散,对设备的性能、安全和使用寿命都是极为不利的。

3、当机房内的回风系统的风量小于服务器机柜的吹风风量时,或者送风系统的风量大于服务器机柜的吸入风量时,热通道的风就有可能通过机柜侧壁与服务器机箱侧边之间的过线间隙回流到系统最前端,此即为热风回流。热风回流对于服务器的散热有非常大的影响,造成服务器风扇转速提高,散热功耗增大,严重时还可能造成系统部件超温,影响正常使用和宕机。

4、但由于热风回流的情况比较隐蔽,维护人员现场检查也难以及时发现风险,通常在服务器已经出现散热异常时才有可能发现机柜存在热风回流的问题,因此,提出一种网络硬件运行风险监测预警系统解决上述技术问题。


技术实现思路

1、本发明的目的在于提供一种网络硬件运行风险监测预警系统,解决以下技术问题:

2、如何提供一种能够及时准确的监测服务器机柜内的温度状态的监测预警系统。

3、本发明的目的可以通过以下技术方案实现:

4、一种网络硬件运行风险监测预警系统,包括:

5、采集模块,用于实时获取目标服务器机柜内的温度值;

6、处理模块,用于接收所述温度值,并对所述温度值进行预处理之后按照预设特征提取规则生成对应的特征图片;

7、分析模块,用于接收所述特征图片,并将所述特征图片输入训练好的温度状态识别模型,获取温度状态判断结果;所述温度状态判断结果包括合格和不合格;

8、预警模块,用于接收所述温度状态判断结果,并在所述温度状态判断结果为不合格时发出预警信号至人工端;

9、其中,所述温度状态识别模型为经过训练的机器学习模型。

10、优选地,实时监测目标服务器机柜内的温度值的过程为:

11、在所述目标服务器机柜上朝向进风端的前面板两侧以及两侧柜壁上分别设置监测点;

12、通过所述监测点分别获取所述监测点位置的温度值。

13、优选地,对所述温度值进行预处理之后按照预设特征提取规则生成对应的特征图片的过程为:

14、通过公式计算温度变化系数;

15、根据所述温度变化系数生成对应的随时间变化的温度系数变化曲线y;

16、在空白图片上匹配设置与所述温度系数变化曲线y对应的坐标轴,并将不同位置的所述监测点的所述温度系数变化曲线y按照预设排列顺序设置在所述空白图片上;

17、其中,αt为t时刻的温度变化系数,tt为t时刻的温度值,t0为预设温度状态值。

18、优选地,所述前面板两侧以及两侧柜壁上设置的监测点呈矩阵排列,根据所述监测点的位置对所述预设排列顺序进行随机设定。

19、优选地,所述分析模块还包括:

20、将所述温度系数变化曲线y与对应的标准区间进行比对:

21、若y∈[ylow,yup],则标准分析符合要求,进行预警分析;

22、否则,标准分析不符合要求;

23、其中,[ylow,yup]表示温度系数对应的标准区间。

24、优选地,所述预警分析的过程为:

25、对y进行求导,获得温度变化量随时间变化曲线y′;

26、将y′与对应的变化量阈值进行比对:

27、若y′<y′th,则预警分析符合要求;

28、否则,预警分析不符合要求;

29、其中,y′th表示温度的变化量阈值。

30、优选地,所述分析模块还包括:根据所述温度状态判断结果、标准分析和预警分析结果对所述温度状态进行评估:

31、通过计算温度状态评估系数con;

32、其中,当温度状态判断结果为合格时,φ1=φ2=0,当温度状态判断结果为不合格时,γ1和γ2为预设权重系数;

33、将con与预设阈值clow、cup进行比对:

34、若con≥cup,则判断温度状态极差;

35、若cup>con>clow,则判断温度状态较差;

36、优选地,所述预警模块还包括:

37、接收所述标准分析和预警分析结果,并在所述标准分析不符合要求和预警分析不符合要求时发出预警信号至人工端;

38、接收所述温度状态评估结果,并在温度状态极差时,发出一级预警;在温度状态较差时,发出二级预警。

39、本发明的有益效果:

40、该网络硬件运行风险监测预警系统,通过获取目标服务器的机柜内的温度值,将温度值进行预处理之后按照预设特征提取规则生成对应的特征图片,然后将根据预设特征提取规则生成对应的特征图片输入训练好的温度状态识别模型,便可对机柜内是否发生热风回流的情况进行实时监测,从而及时准确的发现发生热风回流的情况,进而及时进行干预降低服务器发生运行风险的可能,解决了热风回流情况比较隐蔽,通常在服务器已经出现散热异常时才有可能发现的问题。



技术特征:

1.一种网络硬件运行风险监测预警系统,其特征在于,包括:

2.根据权利要求1所述的网络硬件运行风险监测预警系统,其特征在于,实时监测目标服务器机柜内的温度值的过程为:

3.根据权利要求2所述的网络硬件运行风险监测预警系统,其特征在于,对所述温度值进行预处理之后按照预设特征提取规则生成对应的特征图片的过程为:

4.根据权利要求3所述的网络硬件运行风险监测预警系统,其特征在于,所述前面板两侧以及两侧柜壁上设置的监测点呈矩阵排列,根据所述监测点的位置对所述预设排列顺序进行随机设定。

5.根据权利要求4所述的网络硬件运行风险监测预警系统,其特征在于,所述分析模块还包括:

6.根据权利要求5所述的网络硬件运行风险监测预警系统,其特征在于,所述预警分析的过程为:

7.根据权利要求6所述的网络硬件运行风险监测预警系统,其特征在于,所述分析模块还包括:根据所述温度状态判断结果、标准分析和预警分析结果对所述温度状态进行评估:

8.根据权利要求7所述的网络硬件运行风险监测预警系统,其特征在于,所述预警模块还包括:


技术总结
本发明涉及网络硬件技术领域,公开了一种网络硬件运行风险监测预警系统,包括:采集模块,用于实时获取目标服务器机柜内的温度值;处理模块,用于接收所述温度值,并对所述温度值进行预处理之后按照预设特征提取规则生成对应的特征图片;分析模块,用于接收所述特征图片,并将所述特征图片输入训练好的温度状态识别模型,获取温度状态判断结果;所述温度状态判断结果包括合格和不合格;预警模块,用于接收所述温度状态判断结果,并在所述温度状态判断结果为不合格时发出预警信号至人工端。实时监测机柜内是否发生热风回流的情况,从而及时准确的发现,解决了热风回流情况比较隐蔽,通常在服务器已经出现散热异常时才有可能发现的问题。

技术研发人员:田琳,孔淑琴,盛剑胜,黄远明,林少华,曾智健,吴明兴,罗锦庆,孙谦,赵唯嘉,黄康乾,卢苑,徐云,谢宇霆,龚学良,熊德甫
受保护的技术使用者:广东电力交易中心有限责任公司
技术研发日:
技术公布日:2024/3/11
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1