本发明涉及数据处理,尤其涉及一种多指标异常检测方法、装置、电子设备和存储介质。
背景技术:
1、在现代信息技术发展的背景下,运维监控系统在企业中扮演者至关重要的角色,其是一套通过对大量监控指标进行实时收集和分析,并及时反馈异常情况的系统。它可以帮助企业实时监控各项关键指标,及时发现异常情况,从而采取相应的应对措施,以保证企业的稳定运行。
2、在多指标异常检测场景下,阈值的选择是一个至关重要的环节,合理的阈值设置可以准确地捕获异常,降低误报率。现有的多指标异常检测方法在确定阈值时尚存在一些不足:例如固定阈值选择的方法,其缺点是无法适应数据的变化,由于时序数据通常具有不稳定性和非平稳性,固定阈值可能无法捕捉到数据动态变化的特征,导致误报率高或漏报率高,其次未考虑到数据的分布情况,不同的时序数据可能具有不同的分布,并可能存在偏斜或尾部厚重的情况,因此,单一的固定阈值无法满足所有数据的需求,往往需要根据实际情况进行调整,增加了操作的复杂性;基于历史数据的阈值选择方法,该方法基于历史观测值的统计特征来选择阈值,其缺点是历史数据的选择范围可能对阈值选择产生较大影响,如果历史数据的时间范围过短或过长,都可能导致阈值选择的不准确性,其次,基于历史数据的方法可能存在延迟问题,由于历史数据的更新不及时,阈值选择可能无法及时反映当前的数据变化,从而导致漏报或误报。
技术实现思路
1、本发明提供了一种多指标异常检测方法、装置、电子设备和存储介质,以解决现有多指标异常检测方法存在的检测准确率不高的问题。
2、根据本发明的一方面,提供了一种多指标异常检测方法,该方法包括:
3、根据预设异常检测模型确定原始多指标时序数据对应的多指标重构序列;
4、根据多指标重构序列对应的预设极值分布确定候选阈值集合;
5、根据多指标重构序列和候选阈值集合确定异常分数分布特征,并基于异常分数分布特征在候选阈值集合确定最优阈值序列;
6、根据多指标重构序列和最优阈值序列确定多指标异常检测结果。
7、根据本发明的另一方面,提供了一种多指标异常检测装置,该装置包括:
8、重构序列确定模块,用于根据预设异常检测模型确定原始多指标时序数据对应的多指标重构序列;
9、候选阈值确定模块,用于根据多指标重构序列对应的预设极值分布确定候选阈值集合;
10、最优阈值确定模块,用于根据多指标重构序列和候选阈值集合确定异常分数分布特征,并基于异常分数分布特征在候选阈值集合确定最优阈值序列;
11、异常检测模块,用于根据多指标重构序列和最优阈值序列确定多指标异常检测结果。
12、根据本发明的另一方面,提供了一种电子设备,所述电子设备包括:
13、至少一个处理器;以及
14、与所述至少一个处理器通信连接的存储器;其中,
15、所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例所述的多指标异常检测方法。
16、根据本发明的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本发明任一实施例所述的多指标异常检测方法。
17、本发明实施例的技术方案,通过根据预设异常检测模型确定原始多指标时序数据对应的多指标重构序列;根据多指标重构序列对应的预设极值分布确定候选阈值集合;根据多指标重构序列和候选阈值集合确定异常分数分布特征,并基于异常分数分布特征在候选阈值集合确定最优阈值序列;根据多指标重构序列和最优阈值序列确定多指标异常检测结果。本发明实施例通过根据多指标重构序列和对应预设极值分布确定候选阈值集合,再根据各指标的重构序列对应的异常分数分布特征在相应候选阈值集合中确定最优阈值,考虑到了多指标异常检测时不同指标阈值的差异性,对每个不同指标分别独立搜索最优阈值,有效提高了多指标异常检测的准确率。
18、应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。
1.一种多指标异常检测方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述根据预设异常检测模型确定原始多指标时序数据对应的多指标重构序列,包括:
3.根据权利要求1所述的方法,其特征在于,所述根据所述多指标重构序列对应的预设极值分布确定候选阈值集合,包括:
4.根据权利要求3所述的方法,其特征在于,所述针对各所述重构序列,基于对应预设阈值确定公式、对应预设异常概率集合以及对应所述广义帕累托分布中的形状参数和尺度参数的最大似然估计值,确定各所述重构序列对应的所述候选阈值集合,包括:
5.根据权利要求1所述的方法,其特征在于,所述根据所述多指标重构序列和所述候选阈值集合确定异常分数分布特征,并基于所述异常分数分布特征在所述候选阈值集合确定最优阈值序列,包括:
6.根据权利要求5所述的方法,其特征在于,所述预设密度距离确定公式至少包括:
7.根据权利要求1所述的方法,其特征在于,所述根据所述多指标重构序列和所述最优阈值序列确定多指标异常检测结果,包括:
8.一种多指标异常检测装置,其特征在于,所述装置包括:
9.一种电子设备,其特征在于,所述电子设备包括:
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现权利要求1-7中任一项所述的多指标异常检测方法。