备件异常领用数据识别方法、装置和计算机设备

文档序号:37542481发布日期:2024-04-08 13:42阅读:12来源:国知局
备件异常领用数据识别方法、装置和计算机设备

本技术涉及异常检测,特别是涉及一种备件异常领用数据识别方法、装置、计算机设备、存储介质和计算机程序产品。


背景技术:

1、核电站中设备的维修和保养需要使用到几十万的备件,为确保核电站的稳定运行,除了由人工根据历史经验管理备件库存以外,目前也会基于备件的历史领用数据,预测备件需求,从而管理备件库存。备件的历史领用数据根据业务情况分为很多种类型,如大修领用、日常领用、计划性维修、纠正性维修、改造、老化处理、缺陷处理、替代更换、专项更换等,而其中的老化、改造、替代通常属于临时的一次性大批量更换需求,不属于需要进行库存管理去保障的需求。因此,在基于历史领用数据预测备件库存需求前,需要将老化、改造、替代对应的历史领用数据作为“异常”的领用数据筛选出,并从历史领用数据中剔除,以便后续基于筛选剔除处理的历史领用数据开展备件库存需求预测工作。

2、传统技术中,一般依赖于人工逐条核对筛选并提出“异常”的领用数据,然而,核电备件有几十万的历史领用数据,传统技术中人工处理的方式效率过低,且因数据量庞大,易出现失误、遗漏,即无法准确、高效地从历史领用数据中筛选出异常领用数据。


技术实现思路

1、基于此,有必要针对上述技术问题,提供一种能够准确、高效地从历史领用数据中筛选出异常领用数据的备件异常领用数据识别方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。

2、第一方面,本技术提供了一种备件异常领用数据识别方法,包括:

3、从原始领用数据中提取原始数据特征、各类备件各自的领用序列;领用序列包括表征备件在不同日期的领用数量的多个离散点;

4、确定各类备件的领用序列中不符合领用数量分布规律的异常离散点,将异常离散点在原始领用数据中对应的领用数据作为第一异常数据;

5、从原始数据特征中筛选出用于识别异常领用数据的关键特征,基于关键特征,识别得到原始领用数据中的第二异常数据;

6、基于第一异常数据与第二异常数据,对达到设定长度的领用序列进行趋势预测,并根据预测所得趋势与领用序列的实际趋势之间的对比结果,确定原始领用数据中的第三异常数据;

7、对第一异常数据、第二异常数据及第三异常数据进行数据整合,得到备件异常领用数据。

8、在其中一个实施例中,原始领用数据中的每一领用数据均包括领用日期、领用的备件所属的备件编码;

9、从原始领用数据中提取各类备件各自的领用序列,包括:

10、按照各类备件各自的最新备件编码与历史备件编码之间的对应关系,对原始领用数据中的备件编码进行更新,得到更新领用数据;

11、将更新领用数据中属于相同最新备件编码的领用数据分别进行数据合并,得到各类备件各自的目标领用数据;

12、基于领用日期,从各类备件各自的目标领用数据中,分别提取各类备件各自的领用序列。

13、在其中一个实施例中,确定各类备件的领用序列中不符合领用数量分布规律的异常离散点,包括:

14、针对每类备件,确定备件的领用序列中各离散点的高斯分布规律、以及四分位距分布规律;

15、将所述备件的领用序列中,不符合高斯分布规律或四分位距分布规律的离散点,作为异常离散点。

16、在其中一个实施例中,从原始数据特征中筛选出用于识别异常领用数据的关键特征,包括:

17、将原始数据特征中机器学习算法无法识别的第一类原始数据特征,转换为机器学习算法可识别的特征,得到转换后特征;

18、对原始数据特征中携带隐含特征的第二类原始数据特征进行特征扩展,得到扩展后特征;

19、从各原始数据特征、各转换后特征、以及各扩展后特征中,筛选出用于识别异常领用数据的关键特征。

20、在其中一个实施例中,基于关键特征,识别得到原始领用数据中的第二异常数据,包括:

21、基于关键特征构建多维特征矩阵;

22、将多维特征矩阵输入异常识别模型,得到异常识别模型输出的索引号;索引号用于指示异常领用数据在原始领用数据中的位置;异常识别模型基于多种决策树模型构建得到;

23、基于索引号,确定原始领用数据中的第二异常数据。

24、在其中一个实施例中,异常识别模型的训练过程包括:

25、将不同历史时期的领用数据分别作为训练集、测试集;

26、对训练集中的异常领用数据进行重采样,得到增强训练集,并将增强训练集中非异常领用数据与异常领用数据的比值作为类别权重参数;

27、对初始异常识别模型中的各种模型参数组合进行遍历,确定目标参数组合;

28、通过增强训练集、类别权重参数以及目标参数组合,对初始异常识别模型进行训练,得到训练后模型;

29、基于多种基于梯度提升决策树的模型,评估训练后模型对测试集中异常领用数据的识别效果,得到评估结果;

30、根据评估结果,调整目标参数组合,直至得到的评估结果表征训练后模型的识别效果达到设定标准。

31、在其中一个实施例中,第三异常数据的确定过程包括:

32、将各领用序列中,达到设定长度的领用序列作为目标序列;

33、针对每一目标序列,将目标序列划分第一子序列与第二子序列;

34、将第一子序列中属于第一异常数据或者第二异常数据的离散点剔除,得到训练集序列;训练集序列不携带表征异常领用数据的离散点;

35、预测训练集序列的变化趋势,得到预测子序列;

36、将第二子序列中,与预测子序列中各离散点之间的差距超出设定差距的离散点确定为目标离散点;

37、将目标离散点在原始领用数据中对应的领用数据作为第三异常数据。

38、第二方面,本技术还提供了一种备件异常领用数据识别装置,包括:

39、数据提取模块,用于从原始领用数据中提取原始数据特征、各类备件各自的领用序列;领用序列包括表征备件在不同日期的领用数量的多个离散点;

40、第一异常识别模块,用于确定各类备件的领用序列中不符合领用数量分布规律的异常离散点,将异常离散点在原始领用数据中对应的领用数据作为第一异常数据;

41、第二异常识别模块,用于从原始数据特征中筛选出用于识别异常领用数据的关键特征,基于关键特征,识别得到原始领用数据中的第二异常数据;

42、第三异常识别模块,用于基于第一异常数据与第二异常数据,对达到设定长度的领用序列进行趋势预测,并根据预测所得趋势与领用序列的实际趋势之间的对比结果,确定原始领用数据中的第三异常数据;

43、数据整合模块,用于对第一异常数据、第二异常数据及第三异常数据进行数据整合,得到备件异常领用数据。

44、第三方面,本技术还提供了一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现上述各方法。

45、第四方面,本技术还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述各方法。

46、第五方面,本技术还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述各方法。

47、上述备件异常领用数据识别方法、装置、计算机设备、存储介质和计算机程序产品,先从原始领用数据中提取原始数据特征、各类备件各自的领用序列,其中,领用序列包括表征备件在不同日期的领用数量的多个离散点,然后,确定各类备件的领用序列中不符合领用数量分布规律的异常离散点,将异常离散点在原始领用数据中对应的领用数据作为第一异常数据,得到按照统计学方法筛选出的异常领用数据,再从原始数据特征中筛选出用于识别异常领用数据的关键特征,基于关键特征,可以强针对性、准确识别得到原始领用数据中的第二异常数据,再基于第一异常数据与第二异常数据,对达到设定长度的领用序列进行趋势预测,并根据预测所得趋势与领用序列的实际趋势之间的对比结果,确定原始领用数据中的第三异常数据,以补充对长领用序列中异常领用数据识别的覆盖,有利于更全面地识别异常领用数据,最后,对第一异常数据、第二异常数据及第三异常数据进行数据整合,得到备件异常领用数据。整个过程中,会基于三种方式,全面、准确识别得到较为全面的异常数据,且无需人为对原始领用数据进行逐条核对,因此,可以准确、高效地从历史领用数据中筛选出异常领用数据。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1