基于纤维流多分支索引的在线大数据字典生成方法

文档序号:33722517发布日期:2023-04-05 23:02阅读:95来源:国知局
基于纤维流多分支索引的在线大数据字典生成方法与流程

本发明涉及一种纺纱全流程数据关系对齐方法,具体涉及一种基于纤维流多分支索引的在线纺纱大数据字典生成方法,属于纺纱生产数据处理。


背景技术:

1、纺纱是混合式作业方式,前道工序的清花、梳棉、并条是连续型作业,后道工序的粗纱、细纱是离散型作业,连续与离散生产数据难以对齐。且纺纱企业在设计、生产、试验测试等环节产生的数据大多分散保存在各个不同的信息系统中,难以将业务相关数据汇聚后进一步挖掘数据价值。且这些数据间的映射关系随着工艺改进、产品换代而动态变化。因此,如何在动态制造环境中,建立统一的纺纱数据模型,是亟需解决的关键问题。

2、随着数据感知和工业互联网技术的发展,部分学者开始建立数字总线来集合各类生产过程数据,并根据流程工艺以及时序关系建立数据之间的对应关系。但是,其有效性需要一个先决条件,即数据之间的对应关系不应随着工艺改进、时间变化、环境突变或产品更新而有较大的改变。但在实际纱线生产过程中,纺纱车间具有复杂而实时变化的生产环境,例如原棉的更换,罗拉部件受飞花的缠绕以及车间内温、湿度的变化等,这往往导致先前复杂计算出来的对应关系受到破坏。

3、为了解决这一问题,有些学者提出了稀疏编码的方法,通过将大量的冗余变量去除,只保留与响应变量最相关的解释变量,简化了模型的同时却保留了数据集中最重要的信息,有效地解决了高维数据集建模中的诸多问题。


技术实现思路

1、本发明的目的是:建立纺纱全流程在线大数据字典,通过稀疏编码方法将生产过程的连续型数据与离散型数据进行对齐,找出在纺纱过程的多源异构环境下不同类型数据之间的对应关系,帮助之后进一步挖掘纺纱数据背后的价值。

2、为了达到上述目的,本发明的技术方案是提供了一种基于纤维流多分支索引的在线大数据字典生成方法,其特征在于,包括以下步骤:

3、步骤1:获取生产过程数据,包括离散数据以及以固定时长为单位间隔时间的周期性的连续数据;

4、步骤2:以连续数据作为样本,选取与之对应的部分离散型数据作为初始字典,其中,将样本定义为 y,将初始字典定义为 d,则:第 c个周期的连续数据定义为分支样本 y c,为特定纤维流数据表征向量;将初始字典 d中与分支样本 y c对应的字典矩阵列向量定义为 d c;

5、步骤3:采用fisher判别法对样本 y进行稀疏编码,得到初始优化函数 j y( d, x),如下式所示:

6、

7、式中: dx表示分支样本 y c用字典 d表示的稀疏编码, x为稀疏矩阵;

8、、为超参数;

9、表示稀疏矩阵 x的一范数;

10、为fisher判别项,且有:

11、式中,表示分支样本 y c的约束项; x c表示稀疏矩阵 x中的第 c列向量,稀疏矩阵 x共有 c列向量;表示与分支样本 y c对应的稀疏矩阵 x的第 c列向量;表示与分支样本 y c对应的稀疏矩阵 x的第 j列向量;表示矩阵的二范数;

12、 g(x)为系数判别项,表示为:

13、

14、式中, m表示稀疏矩阵 x的均值矩阵; m c表示均值矩阵 m的第 c列向量;

15、步骤4:预先定义能够表征各分支样本 y c共同特征的共享字典 d 0;在每条离散数据产生后,通过改变共享字典 d 0从而更新步骤3得到的优化函数,在更新后的优化函数中:

16、在系数判别项 g(x)的基础上扩展作为系数共享项,保证共享字典对应系数的相似性, x 0表示与共享字典对应的稀疏矩阵, m 0表示与共享字典对应的均值矩阵,得到扩展后的系数判别项,表示更新后的稀疏矩阵,, x 0表示与共享字典对应的稀疏矩阵;

17、修正fisher判别项 f y (d,x),使得共享字典 d 0能够被稀疏表征;

18、步骤5:使用步骤4得到的更新后的优化函数得到更新后的字典。

19、优选地,扩展后的系数判别项表示为:。

20、优选地,修正后的fisher判别项 f y (d,x)表示为,则有:

21、

22、式中,表示更新后的字典 d;表示更新后的稀疏矩阵的第 c列向量;表示更新后的分支样本矩阵的第 c列向量,,表示与共享字典对应的稀疏矩阵的第 c列向量。

23、优选地,步骤4获得的更新后的优化函数表示为:

24、

25、式中,、、为超参数。

26、优选地,在所述步骤5之后还包括:

27、步骤6:查找字典:

28、通过更新后的字典及想要查找的离散数据 xc,计算得到相对应的连续型数据 yc:。

29、本发明设计了以纺纱过程中的连续型数据作为样本,以离散型数据作为初始字典,采用fisher判别法对样本进行稀疏编码,并通过加入共享字典来实时调整优化函数更新对应关系,最终得到纺纱过程的在线大数据字典。

30、本发明提出了一种基于纤维流多分支索引的在线纺纱大数据字典生成方法,该方法通过稀疏编码方法来建立动态多源异构数据之间的对应关系。与传统利用稀疏编码方法建立数据之间对应关系的研究不同的是,传统方法建立在样本与字典数据较长时间不变的假设前提下,而本发明所提出的方法通过引入表征分支样本之间共同特征的共享字典,能够通过调整优化函数动态地建立表达对应关系的大数据字典。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1