数据异常检测方法、装置、存储介质及计算机设备与流程

文档序号:36357429发布日期:2023-12-14 03:55阅读:23来源:国知局
数据异常检测方法与流程

本发明涉及信息,尤其是涉及一种数据异常检测方法、装置、存储介质及计算机设备。


背景技术:

1、异常检测是数据挖掘和统计分析领域研究的一种重要问题,其目标是从原始数据中检测出与其他数据明显不同的那些数据点,异常检测在许多应用领域都有着广泛的应用,如金融欺诈检测、医学诊断、网络入侵检测等。

2、目前,通常通过统一的检测方法对所有数据进行检测。然而,这种所有数据公用同一种检测方法的方式,由于该种检测方法不一定适用于所有数据,导致对部分数据的异常检测准确度较低。


技术实现思路

1、本发明提供了一种数据异常检测方法、装置、存储介质及计算机设备,主要在于能够提高数据的异常检测准确度。

2、根据本发明的第一个方面,提供一种数据异常检测方法,包括:

3、获取待检测数据源中的数据;

4、对所述待检测数据源中的数据进行分类,得到所述待检测数据源中的数据所属的目标聚类类别;

5、确定所述目标聚类类别对应的异常检测方式;

6、利用所述异常检测方式对所述待检测数据源中的数据进行异常检测,得到所述待检测数据源中的异常数据。

7、可选地,所述对所述待检测数据源中的数据进行分类,得到所述待检测数据源中的数据所属的目标聚类类别,包括:

8、确定所述待检测数据源中的数据对应的分类特征向量,以及确定不同聚类类别下的参考数据对应的参考特征向量;

9、依据所述分类特征向量和所述参考特征向量,分别计算所述待检测数据源中的数据与所述不同聚类类别下的参考数据之间的相似距离;

10、基于所述相似距离,确定所述待检测数据源中的数据所属的目标聚类类别。

11、可选地,在所述确定不同聚类类别下的参考数据对应的参考特征向量之前,所述方法还包括:

12、确定k个团簇对应的初始质心;

13、计算参考数据与所述k个团簇对应的初始质心之间的距离,并基于所述距离,将所述参考数据划分到所述k个团簇中;

14、基于所述k个团簇中的参考数据,确定所述k个团簇对应的更新后的质心;

15、基于所述更新后的质心,重新将所述参考数据划分到所述k个团簇中,直至所述更新后的质心不发生变化,将最终划分到所述k个团簇中的参考数据,确定为所述不同聚类类别下的参考数据。

16、可选地,所述利用所述异常检测方式对所述待检测数据源中的数据进行异常检测,得到所述待检测数据源中的异常数据,包括:

17、若所述待检测数据源中的数据属于资产聚类类别,则确定所述资产聚类类别对应的预设箱须图检测算法;

18、利用所述预设箱须图检测算法对所述待检测数据源中的资产数据进行异常检测,得到所述资产数据中的异常数据;

19、若所述待检测数据源中的数据属于日志聚类类别,则确定所述日志聚类类别对应的预设异常检测模型;

20、利用所述预设异常检测模型对所述待检测数据源中的日志数据进行异常检测,得到所述日志数据中的异常数据。

21、可选地,所述利用所述预设箱须图检测算法对所述待检测数据源中的资产数据进行异常检测,得到所述资产数据中的异常数据,包括:

22、确定所述资产数据对应的中位数据值据值;

23、基于所述资产数据中的最小数据值与所述中位数据值据值,确定所述资产数据对应的下四分位数;

24、基于所述资产数据中的最大数据值与所述中位数据值据值,确定所述资产数据对应的上四分位数;

25、计算所述下四分位数与所述上四分位数之间的距离,得到所述资产数据对应的四分位间距;

26、依据所述下四分位数和所述四分位间距,计算所述资产数据对应的异常检测下限值;

27、根据所述上四分位数和所述四分位间距,计算所述资产数据对应的异常检测上限值;

28、在所述资产数据中,将所述异常检测下限值至所述异常检测上限值范围之外的数据确定为所述资产数据中的异常数据。

29、可选地,在所述利用所述预设异常检测模型对所述待检测数据源中的日志数据进行异常检测,得到所述日志数据中的异常数据之前,所述方法还包括:

30、构建预设初始异常检测模型,并获取样本数据,以及所述样本数据中的实际异常数据;

31、将所述样本数据输入至所述预设初始异常检测模型中进行异常数据检测,得到所述样本数据中的预测异常数据;

32、基于所述实际异常数据和所述预测异常数据,构建所述预设初始异常检测模型对应的损失函数;

33、基于所述损失函数,构建所述预设异常检测模型;

34、所述利用所述预设异常检测模型对所述待检测数据源中的日志数据进行异常检测,得到所述日志数据中的异常数据,包括:

35、获取异常检测类型;

36、确定与所述异常检测类型相对应的检测提示词;

37、将所述待检测数据源中的日志数据和所述检测提示词输入至所述预设异常检测模型中进行异常数据检测,得到所述日志数据中的异常数据。

38、可选地,在所述利用所述异常检测方式对所述待检测数据源中的数据进行异常检测,得到所述待检测数据源中的异常数据之后,所述方法还包括:

39、确定所述目标聚类类别对应的异常告警模板;

40、基于所述异常告警模板,获取所述异常数据对应的各项异常信息;

41、基于所述各项异常信息,生成所述异常数据对应的告警提示单,并将所述告警提示单发送至运维人员终端,以便所述运维人员终端的运维人员针对所述告警提示单对所述异常数据进行修正。

42、根据本发明的第二个方面,提供一种数据异常检测装置,包括:

43、获取单元,用于获取待检测数据源;

44、分类单元,用于对所述待检测数据源中的数据进行分类,得到所述待检测数据源中的数据所属的目标聚类类别;

45、确定单元,用于确定所述目标聚类类别对应的异常检测方式;

46、异常检测单元,用于利用所述异常检测方式对所述待检测数据源中的数据进行异常检测,得到所述待检测数据源中的异常数据。

47、根据本发明的第三个方面,提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现以上数据异常检测方法。

48、根据本发明的第四个方面,提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现以上数据异常检测方法。

49、根据本发明提供的一种数据异常检测方法、装置、存储介质及计算机设备,与目前通过统一的检测方法对所有数据进行检测的方式相比,本发明通过获取待检测数据源中的数据;并对所述待检测数据源中的数据进行分类,得到所述待检测数据源中的数据所属的目标聚类类别;之后确定所述目标聚类类别对应的异常检测方式;最终利用所述异常检测方式对所述待检测数据源中的数据进行异常检测,得到所述待检测数据源中的异常数据。由此通过确定数据源中数据所属的目标聚类类别,之后确定该目标聚类类别对应的异常检测方式,最终利用该异常检测方式对数据进行异常检测,即不同聚类类别下的数据对应不同的异常检测方式,通过数据所属的聚类类别来确定异常检测方式,能够使确定的异常检测方式适用于该类别数据,从而能够提高数据的异常检测准确度。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1