本发明涉及大数据处理与挖掘,尤其涉及一种异常检测方法、装置、电子设备和计算机可读介质。
背景技术:
1、容量分析工作对于提升数据中心服务水平和能力非常重要,借此可掌握各类资源使用情况,及时消除安全隐患。数据中心容量指标不但种类繁多,而且随着节点规模的扩大,指标数量更是无比庞大,同时对实时性提出了更高的要求。
2、在实现本发明过程中,发明人发现现有技术中至少存在如下问题:
3、由于指标数量无比庞大,难以对海量指标进行准确地分析预测和实时监控,导致无法做出及时响应,影响了数据中心的安全性和稳定性。
技术实现思路
1、有鉴于此,本发明实施例提供一种异常检测方法、装置、电子设备和计算机可读介质,以解决难以对海量指标进行准确地分析预测和实时监控的技术问题。
2、为实现上述目的,根据本发明实施例的一个方面,提供了一种异常检测方法,包括:
3、获取指标在正常情况下的真实历史时间序列,采用所述指标的真实历史时间序列对时间序列模型进行训练,从而得到时间序列预测模型,采用所述时间序列预测模型计算所述指标的估计历史时间序列和所述指标的未来时间序列;
4、根据所述指标的真实历史时间序列和所述指标的估计历史时间序列,计算所述指标的历史残差时间序列;
5、采用所述指标的历史残差时间序列对神经网络模型进行训练,从而得到残差预测模型,采用所述残差预测模型计算所述指标的未来残差时间序列;
6、根据所述指标的未来时间序列和所述指标的未来残差时间序列,计算所述指标最终的未来时间序列,从而基于所述指标最终的未来时间序列对所述指标进行异常检测。
7、可选地,基于所述指标最终的未来时间序列对所述指标进行异常检测,包括:
8、获取所述指标在当前时间点对应的在过去一段时间内每天的指标值,从而筛选出所述指标的最大值和最小值;
9、判断所述指标的最大值是否大于所述指标的最大值阈值与最大值阈值系数的乘积,或者,判断所述指标的最小值是否小于所述指标的最小值阈值与最小值阈值系数的乘积;
10、若是,则基于所述指标在当前时间点的真实值和所述指标最终的未来时间序列对所述指标进行异常检测。
11、可选地,基于所述指标在当前时间点的真实值和所述指标最终的未来时间序列对所述指标进行异常检测,包括:
12、从所述指标最终的未来时间序列中获取所述指标在当前时间点的预测值,根据所述指标在当前时间点的预测值和所述指标在当前时间点的真实值计算所述指标在当前时间点的偏差;
13、根据所述指标最终的未来时间序列计算所述指标的标准差,从而基于所述标在当前时间点的偏差和所述指标的标准差对所述指标进行异常检测。
14、可选地,采用所述指标的真实历史时间序列对时间序列模型进行训练,从而得到时间序列预测模型,包括:
15、将所述指标的真实历史时间序列输入到时间序列模型中,以对所述时间序列模型进行训练,从而得到时间序列预测模型。
16、可选地,采用所述时间序列预测模型计算所述指标的估计历史时间序列和所述指标的未来时间序列,包括:
17、将需要计算的各个历史时间点和需要计算的各个未来时间点输入到所述时间序列预测模型,从而输出所述指标的估计历史时间序列和所述指标的未来时间序列。
18、可选地,采用所述指标的历史残差时间序列对神经网络模型进行训练,从而得到残差预测模型,包括:
19、将所述指标的历史残差时间序列输入到神经网络模型中,以对所述神经网络模型进行有监督训练,从而得到残差预测模型。
20、可选地,采用所述残差预测模型计算所述指标的未来残差时间序列,包括:
21、将需要计算的各个未来时间点输入到所述残差预测模型,从而输出所述指标的未来残差时间序列。
22、另外,根据本发明实施例的另一个方面,提供了一种异常检测装置,包括:
23、第一计算模块,用于获取指标在正常情况下的真实历史时间序列,采用所述指标的真实历史时间序列对时间序列模型进行训练,从而得到时间序列预测模型,采用所述时间序列预测模型计算所述指标的估计历史时间序列和所述指标的未来时间序列;
24、残差模块,用于根据所述指标的真实历史时间序列和所述指标的估计历史时间序列,计算所述指标的历史残差时间序列;
25、第二计算模块,用于采用所述指标的历史残差时间序列对神经网络模型进行训练,从而得到残差预测模型,采用所述残差预测模型计算所述指标的未来残差时间序列;
26、检测模块,用于根据所述指标的未来时间序列和所述指标的未来残差时间序列,计算所述指标最终的未来时间序列,从而基于所述指标最终的未来时间序列对所述指标进行异常检测。
27、可选地,所述检测模块还用于:
28、获取所述指标在当前时间点对应的在过去一段时间内每天的指标值,从而筛选出所述指标的最大值和最小值;
29、判断所述指标的最大值是否大于所述指标的最大值阈值与最大值阈值系数的乘积,或者,判断所述指标的最小值是否小于所述指标的最小值阈值与最小值阈值系数的乘积;
30、若是,则基于所述指标在当前时间点的真实值和所述指标最终的未来时间序列对所述指标进行异常检测。
31、可选地,所述检测模块还用于:
32、从所述指标最终的未来时间序列中获取所述指标在当前时间点的预测值,根据所述指标在当前时间点的预测值和所述指标在当前时间点的真实值计算所述指标在当前时间点的偏差;
33、根据所述指标最终的未来时间序列计算所述指标的标准差,从而基于所述标在当前时间点的偏差和所述指标的标准差对所述指标进行异常检测。
34、可选地,所述第一计算模块还用于:
35、将所述指标的真实历史时间序列输入到时间序列模型中,以对所述时间序列模型进行训练,从而得到时间序列预测模型。
36、可选地,所述第一计算模块还用于:
37、将需要计算的各个历史时间点和需要计算的各个未来时间点输入到所述时间序列预测模型,从而输出所述指标的估计历史时间序列和所述指标的未来时间序列。
38、可选地,所述第二计算模块还用于:
39、将所述指标的历史残差时间序列输入到神经网络模型中,以对所述神经网络模型进行有监督训练,从而得到残差预测模型。
40、可选地,所述第二计算模块还用于:
41、将需要计算的各个未来时间点输入到所述残差预测模型,从而输出所述指标的未来残差时间序列。
42、根据本发明实施例的另一个方面,还提供了一种电子设备,包括:
43、一个或多个处理器;
44、存储装置,用于存储一个或多个程序,
45、当所述一个或多个程序被所述一个或多个处理器执行时,所述一个或多个处理器实现上述任一实施例所述的方法。
46、根据本发明实施例的另一个方面,还提供了一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现上述任一实施例所述的方法。
47、根据本发明实施例的另一个方面,还提供了一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现上述任一实施例所述的方法。
48、上述发明中的一个实施例具有如下优点或有益效果:因为通过采用时间序列预测模型计算指标的估计历史时间序列和指标的未来时间序列,采用残差预测模型计算指标的未来残差时间序列,根据指标的未来时间序列和指标的未来残差时间序列,计算指标最终的未来时间序列,从而基于指标最终的未来时间序列对指标进行异常检测的技术手段,所以克服了现有技术中难以对海量指标进行准确地分析预测和实时监控的技术问题。本发明实施例可以对海量指标进行准确地分析预测和实时监控,并提前预判各类容量资源是否达到瓶颈,对可能出现的容量风险进行预警,并且可以实时监测容量使用情况,以便做出及时响应,有效提高数据中心的安全性,保证数据中心安全稳定运行,同时减少维护成本。
49、上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。