一种数据中心通信热管理检测方法及系统与流程

文档序号:37363771发布日期:2024-03-22 10:17阅读:8来源:国知局
一种数据中心通信热管理检测方法及系统与流程

本发明涉及数据中心管理的,特别是涉及一种数据中心通信热管理检测方法及系统。


背景技术:

1、随着云计算、大数据、人工智能等技术的发展与应用,数据中心已经成为现代社会最重要的基础设施之一,覆盖着电商、金融、电信、医疗、工业等各个领域,在促进社会经济发展、提高生产效率、创新科技应用等方面发挥着重要的作用。

2、然而,数据中心的服务器在运行过程中会产生大量的热量,如果不能有效地控制和管理这些热量,将可能导致服务器性能下降甚至损坏,给数据中心的稳定运行带来极大的隐患。因此,对数据中心服务器的热管理进行实时监测和评估,对于保障数据中心的稳定运行具有重要意义。现有的热管理检测方法主要是通过在服务器内部署实时监控的温度传感器,通过温度传感器监测到温度数据对服务器是否运行过热进行简单判断,此方法缺乏对服务器内部热分布以及设备运行状态的综合评估。因此,无法全面地了解服务器的热状态和潜在问题,给数据中心的稳定运行带来风险。


技术实现思路

1、为解决上述技术问题,本发明提供一种提高了服务器温控的准确性、实时性和综合性,能够确保数据中心的稳定运行的数据中心通信热管理检测方法。

2、第一方面,本发明提供了一种数据中心通信热管理检测方法,所述方法包括:

3、获取数据中心服务器的热分布数据信息;

4、利用预先构建的热分布图像提取模型对服务器的热分布数据信息进行图像处理,获得服务器热分布图像;

5、根据预先设定的数据中心服务器温度提取点位对服务器热分布图像进行识别提取,并根据各温度提取点位的实际位置进行数据分布调整,获得服务器温度分布特征矩阵;

6、将服务器温度分布特征矩阵输入至预先构建的服务器发热分析模型中,获得服务器发热指数;

7、采集服务器主机运行功率、服务器散热设备运行功率、服务器散热进风口风速以及服务器散热出风口风速;

8、将相同时间采集的服务器主机运行功率、服务器散热设备运行功率、服务器散热进风口风速、服务器散热出风口风速以及服务器发热指数,按照设定排列顺序转换为服务器温控特征向量;

9、将服务器温控特征向量输入至预先构建的服务器温控评价模型中,获得服务器温控评价参数;

10、根据服务器主机运行功率,调取对应的服务器温控评价阈值;当实时计算得到的服务器温控评价参数大于对应的服务器温控评价阈值时,则向运维人员发出“服务器温控异常”信息。

11、进一步地,所述服务器温控特征向量为:(pzi,psi,vini,vouti,ki);

12、其中,pzi表示在采集时间为i时的服务器主机运行功率,psi表示在采集时间为i时的服务器散热设备运行功率,vini表示在采集时间为i时的服务器散热进风口风速,vouti表示在采集时间为i时的服务器散热出风口风速,ki表示在采集时间为i时的服务器发热指数。

13、进一步地,所述热分布图像提取模型构建方法包括:

14、收集历史数据,构建一个标注数据集,包含数据中心内不同服务器的热分布图像以及相应的温度数据;

15、选择深度学习架构卷积神经网络;

16、构建卷积神经网络模型,包括卷积层、池化层和全连接层;

17、在训练过程中使用数据增强技术,包括旋转、翻转、缩放;

18、选择损失函数,使模型学习热分布图像的特征,所述损失函数包括均方误差和分类交叉熵损失;

19、使用准备好的数据集对模型进行训练,调整参数以最小化选择的损失函数;

20、使用独立的验证集评估模型的性能;

21、将训练好的模型部署到实际数据中心环境中,进行实时的热分布图像提取。

22、进一步地,所述服务器温度分布特征矩阵的获取方法包括:

23、将温度提取点位在图像上的位置映射到实际服务器内的位置,使每个点位对应于服务器上的具体区域;

24、对于识别到的温度提取点位,通过插值技术填充图像中未被识别到的点位的温度值,获取均匀完整的温度分布;

25、将调整后的温度提取点位及其对应的温度值映射到服务器上的位置,构建服务器温度分布特征矩阵。

26、进一步地,所述服务器发热分析模型构建方法包括:

27、对输入数据进行预处理,包括处理缺失值、异常值和数据标准化;

28、对原始数据进行特征工程;

29、选择深度学习模型,捕捉空间相关性和时间相关性;

30、将数据集划分为训练集和验证集;

31、使用训练集对选择的模型进行训练;

32、训练完成后,使用验证集评估其性能,评估指标包括均方误差、决定系数;

33、当模型训练和评估完成后,将其部署到实际的数据中心环境中,实时地接收和分析服务器温度分布数据,并生成发热指数。

34、进一步地,所述服务器温控评价模型构建方法包括:

35、收集历史数据,包括服务器的温度、运行功率、散热设备运行功率、进出风口风速;

36、处理数据中的异常值、缺失值,并进行转换和预处理;

37、从收集到的数据中选择最相关的特征,并进行特征提取,所述特征包括时间序列特征、功率特征、风速特征;

38、选择机器学习模型,包括线性回归、支持向量机、决策树、随机森林、神经网络;

39、使用历史数据对选择的模型进行训练;

40、使用交叉验证评估模型的性能;

41、将训练好的模型部署到实际的数据中心环境中,实时监测服务器的温控状态。

42、进一步地,所述服务器温控异常信息包括服务器标识、异常类型、异常参数值、时间戳、建议措施、联系方式和历史数据。

43、另一方面,本技术还提供了一种数据中心通信热管理检测系统,所述系统包括:

44、数据采集模块,用于获取数据中心服务器的热分布数据信息,并发送;

45、图像处理模块,用于接收热分布数据信息,利用预先构建的热分布图像提取模型对服务器的热分布数据信息进行图像处理,获得服务器热分布图像,并发送;

46、特征提取模块,用于接收服务器热分布图像,根据预先设定的数据中心服务器温度提取点位对服务器热分布图像进行识别提取,并根据各温度提取点位的实际位置进行数据分布调整,获得服务器温度分布特征矩阵,并发送;

47、发热分析模块,用于接收服务器温度分布特征矩阵,将服务器温度分布特征矩阵输入至预先构建的服务器发热分析模型中,获得服务器发热指数,并发送;

48、服务器运行数据采集模块,用于获取服务器主机运行功率、服务器散热设备运行功率、服务器散热进风口风速以及服务器散热出风口风速,并发送;

49、特征向量生成模块,用于接收服务器主机运行功率、服务器散热设备运行功率、服务器散热进风口风速、服务器散热出风口风速以及服务器发热指数,将相同时间采集的服务器主机运行功率、服务器散热设备运行功率、服务器散热进风口风速、服务器散热出风口风速以及服务器发热指数,按照设定排列顺序转换为服务器温控特征向量,并发送;

50、温控评价模块,用于接收服务器温控特征向量,将服务器温控特征向量输入至预先构建的服务器温控评价模型中,获得服务器温控评价参数,并发送;

51、温控异常报警模块,用于接收服务器温控评价参数,根据服务器主机运行功率,调取对应的服务器温控评价阈值;当实时计算得到的服务器温控评价参数大于对应的服务器温控评价阈值时,则向运维人员发出“服务器温控异常”信息。

52、第三方面,本技术提供了一种电子设备,包括总线、收发器、存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述收发器、所述存储器和所述处理器通过所述总线相连,所述计算机程序被所述处理器执行时实现上述任意一项所述方法中的步骤。

53、第四方面,本技术还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一项所述方法中的步骤。

54、与现有技术相比本发明的有益效果为:通过获取服务器的热分布数据信息,采用图像处理和特征提取模型,能够全面监测服务器内部的热分布情况,相较于传统的温度传感器方法,提供更为细致和全面的数据;通过预先构建的发热分析模型,该方法不仅仅检测温度,还通过服务器温度分布特征矩阵和发热指数进行综合评估,更全面地了解服务器的运行状态;

55、该方法实现了实时监测和评估,通过采集实时数据,及时发现服务器的温控异常,有助于及时采取措施,防范潜在问题,提高数据中心的稳定性;通过采集服务器主机运行功率、散热设备运行功率、进风口和出风口风速等多个因素,生成服务器温控特征向量,综合考虑了不同因素对服务器温度的影响,提高了方法的准确性和可靠性;通过及时发出温控异常信息,有助于运维人员在服务器性能受损之前采取措施,实现对服务器的预防性维护,降低了维护成本;

56、综上所述,本方法通过综合考虑多个因素,采用先进的技术手段,提高了服务器温控的准确性、实时性和综合性,能够确保数据中心的稳定运行。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1