一种工业现场时间序列数据的自动标注方法及系统

文档序号：36178119发布日期：2023-11-29 07:37阅读：64来源：国知局

本发明属于工业自动化，更具体地，涉及一种工业现场时间序列数据的自动标注方法及系统。

背景技术：

1、工业自动化是指机器设备或生产过程在不需要人工直接干预的情况下，按预期的目标实现测量、操纵等信息处理和过程控制的统称，是21世纪现代制造领域中重要的技术之一。在纺织、包装、建材、造纸、汽车、电子、环保、钢铁、交通及水处理等领域，工业自动化技术涉及这些行业加工过程的单台设备、工段、生产线，甚至整个工厂，是现代工业的基础支撑技术。企业通过引进自动化技术，可实现提高生产效率、保证产品质量、节省人力成本和确保安全等目的。

2、而工业现场时间序列数据的自动标注技术作为工业自动化的一个典型应用，依托人工智能等高新技术为工业自动化的发展注入了新的活力。而随着工业场景下传感器设备的大量化和多样化，“动态”数据时间序列(例如可穿戴设备)的收集迅速增长，如何高效准确地对多个传感器采集的向量时间序列数据进行自动标注变得越来越重要。

3、但是当前大多数时间序列数据的自动标注方法往往只处理单个传感器所采集的标量时间序列，需要对每个传感器所采集的标量时间序列逐一进行标注，耗时较大，并且也并未关注多个传感器采集的向量时间序列数据的自相关模式/特征，准确率也较低，无法适用于多个传感器采集的向量时间序列数据的自动标注。

技术实现思路

1、针对现有技术的以上缺陷或改进需求，本发明提供了一种工业现场时间序列数据的自动标注方法及系统，用以解决现有技术无法在工业现场的传感器较多的情况下，对工业现场时间序列数据进行准确自动标注的技术问题。

2、为了实现上述目的，第一方面，本发明提供了一种工业现场时间序列数据的自动标注方法，包括：

3、分别对待标注的各工业现场时间序列数据建立其mvar模型，进而得到其在给定类别下的条件概率分布；

4、将各工业现场时间序列数据在给定类别下的条件概率分布进行联立，得到所有工业现场时间序列数据的似然函数后，进行极大似然估计，得到每一个工业现场时间序列属于不同类别的概率，进而对该工业现场时间序列数据的类别进行标注；

5、其中，第n个工业现场时间序列数据为第n个加工过程中所有时刻下的传感器数据向量所构成的序列；每一时刻下的传感器数据向量为该时刻下加工流水线上所有传感器的采集数据所构成的向量。

6、进一步优选地，对第n个工业现场时间序列数据建立的mvar模型为：

7、

8、其中，表示在t时刻之前的历史数据为数据的条件下在yn,t出现的概率；yn,t为第n个工业现场时间序列数据中前t个时刻下的传感器数据向量所构成的序列；k为预设类别总数；αk为在t时刻之前的历史数据为数据的条件下任意工业现场时间序列数据属于第k个类别的概率；φ(·)是均值为零且拥有单位协方差矩阵的高斯分布的多元累积分布函数；ωk为第k个类别所对应的m×m大小的系数矩阵；pk为mvar模型的预设阶次集合中的第k个阶次；均为mvar模型的参数，θk，0为m维系数向量，均为大小为m×m的系数矩阵；m为加工流水线上传感器的总数量。

9、进一步优选地，第n个工业现场时间序列数据在给定类别下的条件概率分布为：

10、

11、其中，zn，k＝1表示第n个工业现场时间序列数据属于第k个类别标签；p为mvar模型预设阶次集合中的最大阶次；

12、进一步优选地，所有工业现场时间序列数据的似然函数的对数表达式log l为：

13、

14、fk(en，k，t，ωk)＝p(yn，t|zn，k＝1，yn，t-1，…，yn，t-p)

15、其中，n为工业现场时间序列数据的总数量；t为加工过程的总时刻数。

16、进一步优选地，进行极大似然估计的方法，包括以下步骤：

17、初始化τn，k、和ωk；其中，τn，k为第n个工业现场时间序列数据属于第k个类别的概率；n＝1，...，n；

18、在e步骤中：遍历k＝1，...，k，若则将τn，k更新为1，否则，将τn，k更新为0；其中，

19、在m步骤中：

20、将αk更新为

21、获取当τn，k＝1时的所有n所构成的集合，作为当前的集合ik；

22、将更新为

23、将ωk更新为其中，|ik|为集合ik中元素的个数；

24、交替e步骤和m步骤进行迭代，直至αk、和ωk均收敛，此时的τn，k即为所求第n个工业现场时间序列数据属于第k个类别的概率。

25、进一步优选地，类别总数k和mvar模型的预设阶次集合{p1，...，pk}的设置方法，包括：

26、k从nk个整数所构成的有序集合中任意选取，p1，...，pk均从np个整数的有序集合中任意选取，得到多组k，p1，...，pk的取值；nk和np均为大于或等于2的整数；

27、采用以下公式计算每一组k，p1，...，pk取值下的bic值；

28、

29、其中，

30、

31、

32、ηmix＝n

33、为k和p1，...，pk这两类参数所有可能取值的集合；为集合中的元素总数

34、获取bic值最小时的一组k,p1,…,pk，来设置类别总数k和mvar模型的预设阶次集合{p1,…,pk}。

35、第二方面，本发明提供了一种工业现场时间序列数据的自动标注系统，包括：存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时执行本发明第一方面所提供的工业现场时间序列数据的自动标注方法。

36、第三方面，本发明还提供了一种计算机可读存储介质，所述计算机可读存储介质包括存储的计算机程序，其中，在所述计算机程序被处理器运行时控制所述存储介质所在设备执行本发明第一方面所提供的工业现场时间序列数据的自动标注方法。

37、总体而言，通过本发明所构思的以上技术方案，能够取得以下有益效果：

38、1、本发明提供了一种工业现场时间序列数据的自动标注方法，考虑到各工业现场时间序列数据如有错误类别标注会导致整体工业现场时间序列数据集的模型误差显著增大，单条工业现场时间序列数据的标注依赖于其它时间序列数据标注反馈出的信息，同时关注到工业现场时间序列数据的自相关特性，分别对待标注的各工业现场时间序列数据建立其mvar模型，进而得到其在给定类别下的条件概率分布，联立后得到所有工业现场时间序列数据的似然函数，并进行极大似然估计，以得到每一个工业现场时间序列属于不同类别的概率，能够在工业现场的传感器较多的情况下，对工业现场时间序列数据进行准确自动标注。

39、2、进一步地，本发明所提供的工业现场时间序列数据的自动标注方法，在进行极大似然估计时，对em算法进行改进，通过加入小噪声，来解决计算瓶颈和数值下溢问题，有效降低了求解标签过程的计算量，减少分类所用时间，大大提高了计算效率，能够快速的处理大量工业时间序列的自动标注问题，在工业时间序列的长度较大时或者种类较多时也能取得较好效果。

40、3、进一步地，本发明所提供的工业现场时间序列数据的自动标注方法，考虑到原始的bic标准中具有较大k的模型比具有较小k的模型获得更高的概率，这在很多场景下违反了简约准则，导致所选择的参数下模型的性能降低，从而不适用，因此，对bic标准进行改进，使用拓展bic标准，使得在其选择的参数下模型能更好地对工业现场时间序列数据进行拟合，以对类别总数k和mvar模型的预设阶次集合{p1,…,pk}进行选取，保证了模型选择问题的一致性。

41、4、进一步地，本发明所提供的工业现场时间序列数据的自动标注方法，能够快速部署到工业现场，对各种工业时间序列数据集的标注都具备适用性。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：岳作功王心怡杨璐遥
技术所有人：华中科技大学
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。