一种故障预测模型构建方法、故障预测方法及系统与流程

文档序号:36884531发布日期:2024-02-02 21:18阅读:17来源:国知局
一种故障预测模型构建方法、故障预测方法及系统与流程

本技术涉及故障预测,更具体地说,涉及一种故障预测模型构建方法、故障预测方法及系统。


背景技术:

1、服务器作为计算资源,往往承载着关键业务和数据,其重要性不言而喻。服务器故障可能对业务连续性产生严重后果,因此需对服务器故障进行预测来避免对业务连续性产生严重后果。

2、传统的服务器故障预测方法主要包括日志分析和异常数据分析。在服务器的运行过程中,某些异常不会在日志中直接表现出来。而异常数据分析需要提前是在服务器未使用状态下对服务器能效进行评估,无法评估服务器在使用过程中的能效变化及对服务器能效变化进行优化。最终会导致对服务器故障进行预测的局限性。

3、因此,如何降低服务器故障预测的局限性,是本技术亟需解决的问题。


技术实现思路

1、有鉴于此,本技术公开了一种故障预测模型构建方法、故障预测方法及系统,在不依赖服务器日志的情况下,从多个维度来分析服务器部件功耗与服务器异常情况,从而降低服务器故障预测的局限性。

2、为了实现上述目的,其公开的技术方案如下:

3、本技术第一方面公开了一种故障预测模型构建方法,所述方法包括:

4、获取待训练的各个服务器的部件功耗数据;所述部件功耗数据至少包括部件数据、时间数据和功耗数据;

5、针对各个服务器的部件功耗数据,按照预设分组方式将所述部件功耗数据进行分组;所述预设分组方式由服务器型号、所属集群和应用场景确定;

6、将分组后的每组部件功耗数据作为训练集,通过所述训练集训练机器学习模型,得到预设分组方式对应的各个预测模型,以完成故障预测模型的构建。

7、优选的,所述获取待训练的各个服务器的部件功耗数据,包括:

8、通过预设接口协议,获取待训练的各个服务器的部件功耗数,其中,所述预设接口协议为对不同厂商的服务器和设备进行统一接口管理的协议。

9、优选的,在所述获取待训练的各个服务器的部件功耗数据之后,所述针对各个服务器的部件功耗数据,按照预设分组方式将所述部件功耗数据进行分组之前,还包括:

10、对所述待训练的各个服务器的部件功耗数据进行预处理;所述预处理用于将部件功耗数据中存在的空值进行填补。

11、本技术第二方面公开了一种故障预测方法,应用于第一方面任意一项所述的故障预测模型构建方法得到的故障预测模型,所述故障预测方法包括:

12、获取待预测的各个服务器的部件功耗数据;

13、针对待预测的各个服务器的部件功耗数据,通过所述故障预测模型对所述部件功耗数据进行分类,得到各个分类结果;

14、将所述各个分类结果进行预测,得到预测结果;

15、若预测结果表示部件功耗数据变化趋势为预设异常趋势,确定服务器的部件异常。

16、优选的,所述针对待预测的各个服务器的部件功耗数据,通过所述故障预测模型对所述部件功耗数据进行分类,得到各个分类结果,包括:

17、针对待预测的各个服务器的部件功耗数据,通过所述故障预测模型对所述部件功耗数据进行服务器型号分类、所属集群分类和应用场景分类,得到服务器型号的分类结果、所属集群的分类结果和应用场景的分类结果。

18、优选的,所述将所述各个分类结果进行预测,得到预测结果,包括:

19、获取所述各个分类结果中所有的部件功耗数据变化趋势;

20、将所有的部件功耗数据变化趋势与预设变化趋势进行比对;所述预设变化趋势至少包括功耗偏离上升趋势、功耗偏离下降趋势和功耗平稳震荡趋势;

21、若所有的部件功耗数据变化趋势与所述功耗偏离上升趋势一致,得到所有部件功耗数据变化趋势为功耗偏离上升的预测结果;

22、若所有的部件功耗数据变化趋势与所述功耗偏离下降趋势一致,得到所有部件功耗数据变化趋势为功耗偏离下降的预测结果;

23、若所有的部件功耗数据变化趋势与所述功耗平稳震荡趋势一致,得到所有部件功耗数据变化趋势为功耗平稳震荡的预测结果。

24、优选的,所述若预测结果表示部件功耗数据变化趋势为预设异常趋势,确定服务器的部件异常,包括:

25、若预测结果为所有部件功耗数据变化趋势为功耗偏离上升的预测结果,或所有部件功耗数据变化趋势为功耗偏离下降的预测结果,确定预测结果表示部件功耗数据变化趋势为预设异常趋势;

26、在预测结果表示部件功耗数据变化趋势为预设异常趋势的情况下,确定服务器的部件异常。

27、优选的,获取部件功耗数据变化趋势的过程,包括:

28、通过预设时间序列分解算法,对待预测的各个服务器的部件功耗数据进行时间序列分解,得到部件功耗数据变化趋势;其中,所述部件功耗数据变化趋势为周期因素影响外的部件功耗数据变化趋势。

29、本技术第三方面公开了一种故障预测模型构建系统,所述系统包括:

30、第一获取单元,用于获取待训练的各个服务器的部件功耗数据;所述部件功耗数据至少包括部件数据、时间数据和功耗数据;

31、分组单元,用于针对各个服务器的部件功耗数据,按照预设分组方式将所述部件功耗数据进行分组;所述预设分组方式由服务器型号、所属集群和应用场景确定;

32、训练单元,用于将分组后的每组部件功耗数据作为训练集,通过所述训练集训练机器学习模型,得到预设分组方式对应的各个预测模型,以完成故障预测模型的构建。

33、本技术第四方面公开了一种故障预测系统,应用于第三方面所述的故障预测模型构建系统得到的故障预测模型,所述故障预测系统包括:

34、第二获取单元,用于获取待预测的各个服务器的部件功耗数据;

35、分类单元,用于针对待预测的各个服务器的部件功耗数据,通过所述故障预测模型对所述部件功耗数据进行分类,得到各个分类结果;

36、预测单元,用于将所述各个分类结果进行预测,得到预测结果;

37、确定单元,用于若预测结果表示部件功耗数据变化趋势为预设异常趋势,确定服务器的部件异常。

38、经由上述技术方案可知,本技术公开了一种故障预测模型构建方法、故障预测方法及系统,获取待训练的各个服务器的部件功耗数据,部件功耗数据至少包括部件数据、时间数据和功耗数据,针对各个服务器的部件功耗数据,按照预设分组方式将所述部件功耗数据进行分组,预设分组方式由服务器型号、所属集群和应用场景确定,将分组后的每组部件功耗数据作为训练集,通过训练集训练机器学习模型,得到预设分组方式对应的各个预测模型,以完成故障预测模型的构建。获取待预测的各个服务器的部件功耗数据,针对待预测的各个服务器的部件功耗数据,通过故障预测模型对部件功耗数据进行分类,得到各个分类结果,将各个分类结果进行预测,得到预测结果,若预测结果表示部件功耗数据变化趋势为预设异常趋势,确定服务器的部件异常。通过上述方案,在不依赖服务器日志的情况下,建立服务器型号、所属集群、应用场景与部件功耗的故障预测模型,通过故障预测模型对将待预测服务器部件功耗数据进行分类得到平稳波动、偏离上升或偏离下降的分类结果,对输出的分类结果进行故障预测来判断该服务器部件是否异常。从多个维度如服务器型号、所属集群、应用场景等维度,来分析服务器部件功耗与服务器异常情况,从而降低服务器故障预测的局限性。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1