一种无标签数值型工业数据流的实时在线分类方法及系统

文档序号:37437901发布日期:2024-03-25 19:37阅读:10来源:国知局
一种无标签数值型工业数据流的实时在线分类方法及系统

本发明属于数据分类,具体涉及一种无标签数值型工业数据流的实时在线分类方法及系统。


背景技术:

1、工业数据流的实时在线监测是生产加工过程中的重要步骤,参数变化直接反映了生产是否工作在正常区间。工业的解释评价系统需要实时处理在线高维数据流,综合多个参数的变化,给出发生各种工程情况的可能性。随着工业技术的发展,越来越多的传感器应用在工业现场,因此工业数据流存在高维、海量、复杂异构的特点,这些特点决定了分类算法复杂度不能过高,但又要求必须具有较高的分类精度且又有实时性的要求,因此给工业数据流的分析带来了巨大的挑战。与传统的静态数据挖掘相比,工业数据流的实时在线分析方法还需具备算法复杂度低,算法精度高的特点,这也是该领域算法分析的难点。

2、工业数据流具有无标签、包含噪声、不同工作状态下存在概念漂移、传感器数据存在丢数据包的特点,这些都是工业数据流在线分类的难点。目前人工智能领域的研究热点是有监督算法,但是工业领域的数据流大部分是无标签的数据,因此有监督的学习算法无法应用,且无标签的工业数据流占到了整个工业数据流的95%以上,因此对无标签的工业数据流的研究更具有科研价值和实际应用价值。

3、工业数据流随着工作状态的改变必然存在概念漂移的现象,概念漂移指的是目标类的底层分布的变化,概念漂移就是一组有序实例到达后,之前的目标概念发生了改变。概念漂移使前后数据的分布发生变化,影响了数据流的稳定性,使得之前的分类模型不再适用于漂移后的数据,导致传统的机器学习模型发生了概念漂移的情况下分类性能显著下降。

4、概念漂移可以大致分为四类,分别是突变概念漂移、渐变概念漂移、增量式概念漂移、重现概念漂移,其中普遍存在的是增量式概念漂移,由于工业现场存在噪声,因此工业现场真实的数据流变化图1所示,实际工业生产数据流存在大量的噪声,特别是微弱的概念漂移淹没在噪声中。由于增量式概念漂移的特点,如何判断到底是噪声还是真正的概念漂移,成为工业数据流增量式概念漂移研究的难点,并且一些工业概念漂移的检测需要最短时间内检测到,检测时间尽可能的短。因概念漂移导致分类精确率下降成为工业数据流实时在线分析的关键问题。


技术实现思路

1、本发明提供一种无标签数值型工业数据流的实时在线分类方法及故障检测系统,以提高工业数据流实时在线分类的精度。

2、为达到上述目的,根据本发明实施例的第一方面,本发明提供了一种无标签数值型工业数据流的实时在线分类方法,包括:获取工业数据的实时数据流;采用由长短窗体组成的滑动嵌套窗体实时截取实时数据流并进行异常检测,获得当前时刻概念漂移的临时标签;根据当前时刻的临时标签的累计数量对工业数据流进行分类。

3、可选地,根据当前时刻的临时标签的累计数量对工业数据流进行分类,包括:在当前时刻连续出现同样临时标签的累计数量达到设定连续累计阈值时,将当前临时标签确定为当前时刻的数据标签。

4、可选地,采用由长短窗体组成的滑动嵌套窗体实时截取实时数据流并进行异常检测,包括:采用由长短窗体组成的滑动嵌套窗体实时截取实时数据流,分别计算长短窗体所截取数据的均值及方差;根据均值及方差确定概念漂移临时标签;概念漂移临时标签包括无异常标签、上升标签、下降标签。

5、可选地,分别计算长短窗体所截取数据的均值及方差,包括:分别计算长短窗体所截取数据的第一均值及第一方差,并计算长短窗体的第一均值的第一差值;基于第一差值计算长短窗体所截取数据的第二均值及第二方差,并计算长短窗体的第二均值的第二差值;基于第二差值计算长短窗体所截取数据的第三均值及第三方差。

6、可选地,在获取工业数据的实时数据流之后,实时在线分类方法还包括:对实时数据流进行预处理;预处理包括:判断实时数据流中的各系列参数是否均超过对应的参数阈值,若超过,则当前工业生产状态为暂态;若不超过,则确定当前生产状态为稳态,触发后续分类算法。

7、根据本发明实施例的第二方面,本发明提供了一种无标签数值型工业数据流的实时在线分类系统,包括:获取模块,用于获取工业数据的实时数据流;检测模块,用于采用由长短窗体组成的滑动嵌套窗体实时截取实时数据流并进行异常检测,获得当前时刻概念漂移的临时标签;分类模块,用于根据当前时刻的临时标签的累计数量对工业数据流进行分类。

8、可选地,分类模块用于:在当前时刻连续出现同样临时标签的累计数量达到设定连续累计阈值时,将当前临时标签确定为当前时刻的数据标签。

9、可选地,检测模块包括:数据流截取计算单元,用于采用由长短窗体组成的滑动嵌套窗体实时截取实时数据流,分别计算长短窗体所截取数据的均值及方差;临时标签判定单元,用于根据均值及方差确定概念漂移临时标签;概念漂移临时标签包括无异常标签、上升标签、下降标签。

10、可选地,数据流截取计算单元用于:分别计算长短窗体所截取数据的第一均值及第一方差,并计算长短窗体的第一均值的第一差值;基于第一差值计算长短窗体所截取数据的第二均值及第二方差,并计算长短窗体的第二均值的第二差值;基于第二差值计算长短窗体所截取数据的第三均值及第三方差。

11、可选地,还包括预处理模块,用于对实时数据流进行预处理;预处理包括:判断实时数据流中的各系列参数是否均超过对应的参数阈值,若超过,则当前工业生产状态为暂态;若不超过,则确定当前生产状态为稳态,触发检测模块执行分类算法。

12、本发明实施例的无标签数值型工业数据流的实时在线分类方法及系统,通过采用滑动嵌套窗体来实时截取工业数据流来进行数据异常检测,相当于把各个工业状态下的时间序列的数据流映射到派生空间,在新的空间里概念漂移得以体现、噪声得以抑制,解决了因概念漂移导致的工业数据分类精确率下降问题;以及根据时间序列跟时间排列相关联的特点,采用连续标志累计数量进行数据分类的方式,以当前时刻数据连续变化特征作为概念漂移的依据,提高增量式概念漂移检测的时效性,解决了传统统计算法忽略时间标签导致算法失效的问题。该工业数据流的实时在线分类方法相比传统方法,能够显著提高实时在线分类的精度,并且算法的复杂度满足工业生产加工的需求。



技术特征:

1.一种无标签数值型工业数据流的实时在线分类方法,其特征在于,包括:

2.根据权利要求1所述的一种无标签数值型工业数据流的实时在线分类方法,其特征在于,所述根据当前时刻的临时标签的累计数量对工业数据流进行分类,包括:

3.根据权利要求1所述的一种无标签数值型工业数据流的实时在线分类方法,其特征在于,所述采用由长短窗体组成的滑动嵌套窗体实时截取实时数据流并进行异常检测,

4.根据权利要求3所述的一种无标签数值型工业数据流的实时在线分类方法,其特征在于,所述分别计算长短窗体所截取数据的均值及方差,包括:

5.根据权利要求1-4中任一项所述的一种无标签数值型工业数据流的实时在线分类方法,其特征在于,在获取工业数据的实时数据流之后,所述实时在线分类方法还包括:

6.一种无标签数值型工业数据流的实时在线分类系统,其特征在于,包括:

7.根据权利要求6所述的一种无标签数值型工业数据流的实时在线分类系统,其特征在于,所述分类模块用于:在当前时刻连续出现同样临时标签的累计数量达到设定连续累计阈值时,将当前临时标签确定为当前时刻的数据标签。

8.根据权利要求6所述的一种无标签数值型工业数据流的实时在线分类系统,其特征在于,所述检测模块包括:

9.根据权利要求8所述的一种无标签数值型工业数据流的实时在线分类系统,其特征在于,所述数据流截取计算单元用于:分别计算长短窗体所截取数据的第一均值及第一方差,并计算长短窗体的第一均值的第一差值;

10.根据权利要求6-9中任一项所述的一种无标签数值型工业数据流的实时在线分类系统,其特征在于,还包括预处理模块,用于对所述实时数据流进行预处理;


技术总结
本发明实施例提供一种无标签数值型工业数据流的实时在线分类方法及系统。其中,无标签数值型工业数据流的实时在线分类方法包括:获取工业数据的实时数据流;采用由长短窗体组成的滑动嵌套窗体实时截取实时数据流并进行异常检测,获得当前时刻概念漂移的临时标签;根据当前时刻的临时标签的累计数量对工业数据流进行分类。采用本发明的技术方案,可以因概念漂移导致的工业数据分类精确率下降问题,能够显著提高实时在线分类的精度,并且算法的复杂度满足工业生产加工的需求。

技术研发人员:李广,梁静,李玉春,李志梦,吴超,高雅昆,史春逢
受保护的技术使用者:河南工学院
技术研发日:
技术公布日:2024/3/24
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1