数据处理方法、装置、设备和存储介质与流程

文档序号:28678966发布日期:2022-01-29 00:29阅读:99来源:国知局
数据处理方法、装置、设备和存储介质与流程

1.本技术涉及计算机技术领域,特别是涉及一种数据处理方法和装置、一种电子设备和一种存储介质。


背景技术:

2.多变量预测控制(multivariable predictive control)是指具有多个输入量或输出量的,采用多步测试、滚动优化和反馈校正等控制策略的一种控制方法。多变量预测控制系统又称多输入多输出系统,广泛应用于工业生产、大数据处理以及人工智能等领域中。实际应用中,多变量预测控制系统通常采用预测模型,输入自变量,通过闭环反馈控制的思想预测因变量。然而,预测过程中,存在着大量难以测量、无法测量以及测量存在较大滞后的被控变量(即因变量),传统的检测方式无法提供闭环回路中的反馈信息,致使反馈控制便无法实现。因此,现有技术中,多变量预测控制系统的预测性能较差,准确率较低。
3.以工业生产领域为例,随着自动化技术的不断进步,现代工业已开始逐步进入全自动化生产阶段。在工业生产中,得益于自动化技术中闭环反馈控制的核心思想,可通过对工业生产中的被控变量进行感知,从而调控生产过程,以有效克服生产过程中的扰动,实现生产过程的自动化控制。
4.软测量技术的出现为解决上述问题提供了一种方法。由于整个工业生产过程中的众多变量间存在相互耦合关系,因此软测量的核心思想是利用容易直接测量的变量(即自变量)建立模型,进而预测难以测量的变量(即因变量)。基于软测量技术的闭环反馈控制性能,在很大程度上取决于对因变量的预测性能,因此,构建一种实时性好、预测精准的软测量模型能够为后续的过程控制与优化提供有效的感知基础。
5.目前软测量技术通常分为两大类:基于模型的测量技术和基于数据的测量技术。由于基于数据的软测量方法无需大量工业过程的机理知识为基础,仅依靠现场采集的大量数据,构建模型来刻画对象的特性,因此得到了广泛的研究与发展,一些技术数据的软测量模型也广泛应用于工业测量领域。
6.在实际工业应用中,软测量模型通常需要对多个因变量进行预测,导致其预测性能较差。


技术实现要素:

7.本技术实施例提供了一种数据处理方法,以提升多变量预测控制系统的预测性能。
8.相应的,本技术实施例还提供了一种数据处理装置、一种电子设备以及一种存储介质,用以保证上述方法的实现及应用。
9.为了解决上述问题,本技术实施例公开了一种数据处理方法,所述方法包括:
10.获取目标事务的待预测数据;所述目标事务包括根据所述待预测数据执行的生产事务或参数预测事务;
11.将所述待预测数据输入至目标预测器,得到预测结果;其中,所述预测结果包括至少两个因变量;所述待预测数据包括所述因变量的自变量;
12.所述目标预测器包括图卷积层,所述图卷积层包括根据样本数据训练得到的图结构,所述图结构的结点包括所述样本数据中的样本因变量。
13.本技术实施例还公开了一种数据处理装置,所述装置包括:
14.获取目标生产事务的自变量数据;所述自变量数据包括起点元素加入量,或所述自变量数据包括起点元素加入量以及过程控制变量;
15.将所述自变量数据输入至目标预测器,得到预测结果;其中,所述预测结果包括至少两个因变量;所述因变量包括终点元素含量;
16.所述目标预测器包括图卷积层,所述图卷积层包括根据样本数据训练得到的图结构,所述图结构的结点包括所述样本数据中的样本因变量。
17.本技术实施例公开了一种数据处理方法,所述方法包括:
18.获取目标生产事务的自变量数据;所述自变量数据包括起点元素加入量,或所述自变量数据包括起点元素加入量以及过程控制变量;
19.将所述自变量数据输入至目标预测器,得到预测结果;其中,所述预测结果包括至少两个因变量;所述因变量包括终点元素含量;
20.所述目标预测器包括图卷积层,所述图卷积层包括根据样本数据训练得到的图结构,所述图结构的结点包括所述样本数据中的样本因变量。
21.本技术实施例还公开了一种数据处理装置,所述装置包括:
22.数据获取模块,用于获取目标事务的待预测数据;所述目标事务包括根据所述待预测数据执行的生产事务或参数预测事务;
23.数据预测模块,用于将所述待预测数据输入至目标预测器,得到预测结果;其中,所述预测结果包括至少两个因变量;所述待预测数据包括所述因变量的自变量;
24.所述目标预测器包括图卷积层,所述图卷积层包括根据样本数据训练得到的图结构,所述图结构的结点包括所述样本数据中的样本因变量。
25.本技术实施例公开了一种数据处理方法,所述方法包括:
26.获取工业生产事务的工业参数;
27.将所述工业参数输入至目标预测器,得到预测结果;其中,所述预测结果包括至少两个预测参数;所述目标预测器包括图卷积层,所述图卷积层包括根据样本数据训练得到的图结构,所述图结构的结点包括所述样本数据中的样本预测参数。
28.本技术实施例还公开了一种数据处理装置,所述装置包括:
29.参数获取模块,用于获取工业生产事务的工业参数;
30.参数预测模块,用于将所述工业参数输入至目标预测器,得到预测结果;其中,所述预测结果包括至少两个预测参数;所述目标预测器包括图卷积层,所述图卷积层包括根据样本数据训练得到的图结构,所述图结构的结点包括所述样本数据中的样本预测参数。
31.本技术实施例还公开了一种电子设备,包括:处理器;和存储器,其上存储有可执行代码,当所述可执行代码被执行时,使得所述处理器执行如本技术实施例中一个或多个所述的方法。
32.本技术实施例还公开了一个或多个机器可读存储介质,其上存储有可执行代码,
当所述可执行代码被执行时,使得处理器执行如本技术实施例中一个或多个所述的方法。
33.与现有技术相比,本技术实施例包括以下优点:
34.在本技术实施例中,获取目标事务的待预测数据,将所述待预测数据输入至目标预测器,得到预测结果;预测结果中包括至少两个因变量,且所述目标预测器包括图卷积层,所述图卷积层为以多因变量为结点的图结构,图结构中利用图卷积运算将具有相关关系的因变量相互连接,使不同因变量在预测过程相互影响;基于因变量之间的耦合关系,提升目标预测器在一些预测性能不佳的因变量上的表现,提高多因变量预测的综合软测量性能,提升预测准确率。
附图说明
35.图1是本技术实施例的一种数据处理方法的应用示意图之一;
36.图2是本技术实施例的一种数据处理方法的应用示意图之二;
37.图3是本技术的一种数据处理方法实施例的步骤流程图;
38.图4是本技术的又一种数据处理方法实施例的步骤流程图;
39.图5是本技术的又一种数据处理方法实施例的步骤流程图;
40.图6是本技术的一种数据处理装置实施例的结构框图;
41.图7是本技术的一种数据处理装置可选实施例的结构框图;
42.图8是本技术的另一种数据处理装置实施例的结构框图;
43.图9是本技术的另一种数据处理装置实施例的结构框图;
44.图10是本技术一实施例提供的装置的结构示意图。
具体实施方式
45.为使本技术的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本技术作进一步详细的说明。
46.本技术的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。
47.本技术实施例中可应用于工业生产等变量预测领域,在多因变量的预测过程中,通过图卷积层挖掘相关变量之间的相互关系;基于以多因变量为结点的图结构,采用图卷积运算将具有相关关系的结点相连接,使不同因变量在预测过程相互影响,以提高多因变量预测的综合软测量性能。
48.如图1所示,图1示出了本技术实施例的一应用场景示意图。图1中为对目标事务的因变量进行预测的场景示意图,其中目标事务可以是工业生产、大数据处理等事务;其中,输入数据为待预测数据,即自变量;将所述待预测数据输入至目标预测器,得到预测结果,预测结果即作为因变量的输出数据。由图1可知,输出数据中包括多个因变量,即所述目标预测器用于多因变量的预测。申请人发现,由于多个因变量由于处在同一控制过程中,各因变量的波动相互影响,因此,各因变量之间存在较强的耦合关系;而现有技术中的软测量模型,在预测过程中通常仅考虑了自变量对因变量的影响,而忽略了因变量之间的耦合关系。
49.以工业生产领域的软测量模型为例,现有技术中存在多种基于数据的软测量模
型,例如主成分回归(principal component regression,pcr)、偏最小二乘回归(partial least squares regression,pls)、高斯过程回归(gaussian process regression,gpr)等多元统计分析方法;除此之外,还包括支持向量回归(support vector regression,svr)、随机森林、人工神经网络(artificial neural network,ann)等机器学习模型,也逐渐广泛应用于工业软测量领域。现有软测量模型在预测过程中,通常未考虑多因变量间的相关关系,导致预测性能较差。
50.而本技术实施例中,结合因变量之间的相关性,对因变量进行预测,具体地,结合图1,在本技术实施例的步骤101中,首先获取目标事务的待预测数据;所述目标事务包括根据所述待预测数据执行的生产事务或参数预测事务。
51.目标事务可以是工业生产事务,例如炼钢;随着自动化技术的不断进步,现代工业已开始逐步进入全自动化生产阶段。在工业生产中,得益于自动化技术中闭环反馈控制的核心思想,可通过对工业生产中的被控变量进行感知,从而调控生产过程,以有效克服生产过程中的扰动,实现生产过程的自动化控制。
52.目标事务还可以是其他预测事务,例如温度预测,污水污染预测等。待预测数据为预测过程的自变量,通常为容易直接测量的变量,根据待测数据预测因变量。因变量即预测结果,通常为难以预测的变量。
53.作为第一示例,目标事务为炼钢,则自变量包括合金加入量、过程变量、钢水相关数据等参数;合金加入量即各个合金的加入量;过程变量例如温度、时间等变量。而因变量为终点元素含量,终点元素例如酸溶铝(als)、碳(c)、铬(cr)、钼(mo)等;由于终点元素含量难以直接测量和控制,且终点元素之间部分元素会互相影响,基于自变量进行预测得到因变量。
54.作为第二示例,目标事务为温度预测事务,自变量包括湿度百分比、露点温度、风速、云层覆盖率等,以及采样温度值;因变量为目标预测时间段内每个单元时间的温度,例如目标预测时间段为1天,则因变量为一天中的每小时,而每小时的温度是有一定的关联性的,即因变量之间存在一定的耦合性。
55.作为第三示例,目标事务为污水污染预测事务,自变量包括温度、流量、酸碱度、溶解氧浓度、氧化还原电位、浊度和电导率等变量;因变量包括化学需氧量(chemical oxygen demand,cod)、硝酸盐、磷酸盐浓度等,各因变量检测耗时较长,且流程复杂;因此,通过自变量预测因变量。
56.步骤102中,将所述待预测数据输入至目标预测器,得到预测结果;其中,所述预测结果包括至少两个因变量;所述待预测数据包括所述因变量的自变量。
57.其中,预测结果中包括至少两个因变量,也即本技术实施例为多因变量预测过程,而多因变量在实际生产应用过程中,若存在一定的相关性,则会相互影响。
58.针对引入多因变量间的相关性信息,图卷积网络是近年来发展迅速的一种用于挖掘图结构中相互关系的机器学习模型。本技术实施例中,目标预测器为预先训练的预测器,在训练过程中引入多因变量之间的相关性信息,所述目标预测器包括图卷积层,所述图卷积层包括根据样本数据训练得到的图结构,所述图结构的结点包括所述样本数据中的样本因变量,样本因变量即样本数据中的因变量,即已知的因变量值;样本数据中,每组数据包括样本自变量和样本因变量;将样本自变量输入至预测器得到预测因变量,然后根据已知
的样本因变量与预测因变量的差距对预测器进行反向优化,最终得到满足精确度要求的预测器即为所述目标预测器。
59.图卷积网络以其能够方便地在非欧式空间中进行运算的优势,在社交网络关系分析、文件分类、交通预测等领域得到了广泛的应用。图卷积层为以样本因变量为结点的图结构,图结构通常由结点和边组成,结点间的相互关系由边来描述。如图1所示,图1中每个结点n对应图卷积层的一个特征,相邻结点n之间的边表示两个相邻结点的相互关系。可以理解的是,图1仅对图卷积层进行示意,实际结点数量不一定以图1中所示为准。通过图卷积运算,将每个结点的相邻结点特征的加权求和作为该结点的特征;因此通过图卷积运算,能够基于图结构下所描述的相互关系来提取结点的特征。
60.待预测数据作为输入数据输入目标预测器之后,经过图卷积层进行特征提取,得到作为预测结果的输出数据;如图1所示,输出数据中包括n个因变量,每个因变量对应一个通道,在图卷积层,每个具有相互关系的因变量的通道相连接,使得图卷积层在进行特征提取时,参考这种相互关系,使得多因变量之间的相互关系对预测结果产生影响。
61.现有技术中,图卷积网络通常将样本视为结点,挖掘样本之间的相互关系,而挖掘非变量之间的相互关系,因此无法有效引入多因变量间的相关性信息;而本技术实施例中,针对具有多因变量的工业软测量场景,引入多因变量间的相关性信息,从而实现预测性能的提升。
62.除此之外,现有技术中的图卷积网络,结点间的相互关系通常采用距离度量指标来计算,距离并不能很准确地描述结点之间的相关性信息。而本技术实施例中,目标预测器中每个通道可利用自变量信息独立地学习不同的因变量,同时多因变量分别作为图卷积层中的不同结点,通过图卷积层中的边来描述结点之间的相关性强弱,准确地衡量结点之间的相关性。
63.参考上述第一示例,以炼钢为例,自变量包括合金加入量、过程变量、钢水相关数据等;将自变量输入至目标预测器,目标预测器对自变量进行特征提取,通过目标预测器的图卷积层,将各个因变量之间的相关关系融合在预测过程中,得到作为预测结果的因变量;因变量为终点元素含量,终点元素例如酸溶铝(als)。元素例如碳(c)、铬(cr)、钼(mo)等,预测结果中,包括每个终点元素的含量;由于目标预测器为预先经过训练的预测器,其精确度满足预设的精确度需求,因此基于目标预测器预测的终点元素含量的精确度也较高。
64.本技术上述实施例中,获取目标事务的待预测数据,将所述待预测数据输入至目标预测器,得到预测结果;预测结果中包括至少两个因变量,且所述目标预测器包括图卷积层,所述图卷积层为以多因变量为结点的图结构,图结构中利用图卷积运算将具有相关关系的因变量相互连接,使不同因变量在预测过程相互影响;基于因变量之间的耦合关系,提升目标预测器在一些预测性能不佳的因变量上的表现,提高多因变量预测的综合软测量性能,提升预测准确率。本技术实施例解决了现有技术中,软测量模型的预测性能较差的问题。
65.如图2所示,在一个可选实施例中,所述目标预测器还包括目标全连接层,所述目标全连接层包括第一全连接层(图2中全连接层1)、第二全连接层(图2中全连接层2)以及第三全连接层(图2中全连接层3);
66.其中,所述第一全连接层、所述图卷积层、所述第二全连接层以及所述第三全连接
层依次连接;可以理解的是,目标全连接层中包括的全连接层数目还可以是除3之外的其他数据,本技术实施例中仅以全连接层数目为3作示意说明。
67.目标预测器中,每一层对输入数据进行特征提取,所提取的特征为输出数据;
68.前一层的输出数据为后一层的输入数据;
69.所述第一全连接层的输入数据为所述待预测数据,经第一全连接层对待预测数据进行特征提取后,将提取的特征以输入数据输入至图卷积层;然后图卷积层对对输入数据进行特征提取,将提取的特征以输入数据输入至第二全连接层;第二全连接继续对输入数据进行特征提取,并将提取的特征输入至第三全连接层,所述第三全连接层的输出数据为所述预测结果。参考上述第一示例,待预测数据包括合金加入量、过程变量、钢水相关数据等参数,将上述参数输入至目标预测器,经过目标预测器的每一层进行特征提取,最终得到预测结果,预测结果中包括本次炼钢的终点元素含量,例如酸溶铝(als)、碳(c)、铬(cr)、钼(mo)等元素含量。
70.在一个可选实施例中,每个所述目标全连接层包括n个通道,n为所述因变量的数目,所述通道对一个所述因变量进行处理。
71.在目标预测器中,每个因变量对应一个通道,如图2中所示,因变量1对应通道1,因变量2对应通道2,
……
,因变量n对应通道n;在输入待预测数据时,每组待预测数据对应一个通道,也就是说,每个通道输入一组完整的待预测数据;每组待预测数据在每个全连接层的每个通道进行独立的特征提取,在图卷积层基于因变量间的相关性进行图卷积运算,最终第三全连接层的每个通道输出一种因变量。
72.在一个可选实施例中,所述图结构中,每个所述结点的特征值为对相邻结点加权求和的结果;
73.所述图结构中的权重为每相邻的两个所述结点之间的权重,用于度量两个相邻结点之间的相互关系;所述图结构中,权重为所述样本因变量的邻接矩阵中的元素;在图卷积网络中,每个结点的特征值由其所有的相邻结点加权求和得到,而其中的权重由两个相邻结点之间的相互关系决定。
74.所述权重为邻接矩阵中的元素,所述邻接矩阵为根据所述样本因变量生成的,邻接矩阵用于标识每两个相邻结点之间的关系,比如aij表示结点i与结点j之间的关系,若aij为0,表示结点i与结点j没有关系,相应在图卷积网络中结点i与结点j没有边;aij不为0时表示权重,即结点i与结点j之间的关联程度,相应在图卷积网络中结点i与结点j有边,且可通过不同的边显示不同权重。邻接矩阵提取自目标预测器的样本数据,在目标预测器训练成型之后,利用目标预测器预测事务时,邻接矩阵中的元素不再调整。这样,基于结点之间的权重,更准确地来度量因变量之间的相互关系,而现有技术中的图卷积网络,通常采用距离度量相互关系,距离并不能很好地描述结点之间的相关性信息。
75.在一个可选实施例中,所述获取目标事务的待预测数据的步骤之前,需要训练所述目标预测器,训练目标预测器的过程,主要包括以下步骤:
76.步骤11,获取所述样本数据;其中,所述样本数据包括训练样本以及测试样本。
77.步骤12,根据所述训练样本,训练初始预测器,得到待测试预测器;
78.步骤13,根据所述测试样本,对所述待测试预测器进行测试,得到所述目标预测器。
79.样本数据为目标事务的样本数据,步骤11中,获取目标事务的样本数据;为例提高目标预测器的预测准确率,可以获取大量的样本数据进行训练。样本数据中包括训练样本以及测试样本,训练样本用于训练预测器,而测试样本用于对所训练的预测器进行准确率测试,以得到满足准确率要求的目标预测器。样本数据中包括自变量(后续成为样本自变量)以及因变量(后续称为样本因变量),也就是说,样本数据中的因变量是已知的,在预测器训练的过程中,训练样本中的样本因变量用于对预测器进行反向优化;在测试过程中,测试样本中的样本因变量用于对预测器输出的预测结果,进行准确率判断。
80.具体地,在步骤12中,将所述训练样本输入至初始预测器,得到预测结果,并根据已知的样本因变量对预测器进行反向优化,然后迭代下一个训练样本,最终得到满足预设要求的待测试预测器。在步骤13,根据所述测试样本,对所述待测试预测器进行测试,得到满足准确率要求的目标预测器。结合上述第一示例,获取炼钢事务的样本数据,将样本数据按照一定的比例分成训练样本以及测试样本;可选地,分配比例可以是8:2,或其他分配比例;样本数据包括历史生产任务中的实际数据,即实际的自变量以及对应的因变量值,实际的自变量为合金加入量、过程变量、钢水相关数据等参数,实际的因变量为终点元素的实际含量;将实际的自变量输入至初始预测器,得到终点元素的预测含量,然后根据预测含量与实际含量之间的差异对预测器进行反向优化,并迭代下一个样本数据;如此循环迭代,至得到满足准确率要求的待测试预测器,然后利用测试样本进行测试,得到预测终点元素含量的准确率满足要求的目标预测器。
81.在一个可选实施例中,步骤12之前,所述方法还包括:
82.对所述样本数据进行归一化处理;通过归一化处理以消除不同变量之间存在的量纲差异,可选地,可采用min-max归一化方式将所有变量的数值通过线性变换转换至[0,1]的区间内。
[0083]
在一个可选实施例中,所述样本数据中的样本包括样本自变量以及所述样本因变量;
[0084]
步骤12包括:
[0085]
步骤121,将所述训练样本中的第一训练样本的第一样本自变量输入初始预测器,得到第一预测内容。
[0086]
第一训练样本为训练样本中任一样本,输入初始预测器得到第一预测内容。第一训练样本包括第一样本自变量和第一样本因变量。
[0087]
步骤122,根据所述第一预测内容与所述第一训练样本的第一样本因变量,对所述初始预测器进行反向优化,得到优化预测器。
[0088]
若第一预测内容与第一样本因变量之间存在差异,则根据所述差异对初始预测器进行反向优化,以抵消这种差异,使得预测器的预测准确率。
[0089]
步骤123,将所述训练样本中的第二样本自变量迭代输入所述优化预测器,并进行所述反向优化,至迭代次数满足第一预设要求和/或损失函数满足第二预设要求,得到待测试预测器。
[0090]
将第二样本自变量迭代至优化预测器,并根据第二样本自变量对应的因变量继续对预测器进行反向优化,
……
,如此循环至达到循环迭代终止条件,得到待测试预测器。
[0091]
其中,循环迭代终止条件包括迭代次数满足第一预设要求,以及损失函数满足第
二预设要求中的至少一种。具体地,第一预设要求可以是迭代次数达到一预设数值;第二预设要求可以是损失函数计算的损失值低于预设数值,损失函数为预测器预测的值与实际值之间的差异,比如第一示例中,损失函数为终点元素的预测量与真实值之间的差异。
[0092]
在一个可选实施例中,所述初始预测器包括初始全连接层以及初始图卷积层;每个所述初始全连接层包括n个通道;
[0093]
所述初始全连接层包括第四全连接层、第五全连接层以及第六全连接层;初始全连接层对应目标预测器中的目标全连接层;相应地,第四全连接层对应在预测器训练完成的第一全连接层;第五全连接层对应预测器训练完成之后的第二全连接层;第六全连接层对应预测器训练完成之后的第三全连接层;初始图卷积层对应预测器训练完成之后的目标全连接层。
[0094]
其中,所述第四全连接层、所述初始图卷积层、所述第五全连接层以及所述第六全连接层依次连接,每一层对输入数据进行特征提取,所提取的特征为输出数据;前一层的输出数据为后一层的输入数据;根据前述对应关系,初始全连接层中每一层的功能也对对应的目标全连接层的功能相同,比如第四全连接层与第一全连接层,二者采用相同的算法提取输入数据的特征,而算法的参数可能不同,在预测器训练过程中参数不断优化,最终得到第一全连接层;其它全连接层以及图卷积层情况相同,本技术实施例在此不再赘述。
[0095]
在一个可选实施例中,步骤121包括:
[0096]
步骤1211,将所述训练样本中的第一训练样本的第一样本自变量输入初始预测器;
[0097]
步骤1212,在每个所述初始预测器的初始全连接层,根据第一数据关系,计算输出数据;以及在所述初始预测器的初始图卷积层,根据第二数据关系,计算输出数据;
[0098]
步骤1213,获取所述第六全连接层的输出数据,作为第一预测内容。
[0099]
结合图2,图2中全连接层1为本实施例中第四全连接层,全连接层2为本实施例中第五全连接层,全连接层3为第六全连接层,图卷积层为初始图卷积层。在初始全连接层中的几个全连接层,采用第一数据关系进行特征提取;需要说明的是,各个全连接层的第一数据关系并非完全相同,其中可能存在参数不同的情况;并且,同一个全连接层内的不同通道,第一数据关系也并非完全相同,也可能存在参数不同的情况。
[0100]
在初始图卷积层中,根据第二数据关系对第四全连接层输入的数据进行特征提取,对于每个结点,根据权重对其相邻结点加权求和,得到该结点的特征值,所述权重为邻接矩阵中的元素,所述邻接矩阵为根据所述样本因变量生成的,邻接矩阵用于表示每两个相邻结点之间的关系,比如aij表示结点i与结点j之间的关系,若aij为0,表示结点i与结点j没有关系,相应在图卷积网络中结点i与结点j没有边;aij不为0时表示权重,即结点i与结点j之间的关联程度,相应在图卷积网络中结点i与结点j有边,且可通过不同的边显示不同权重。邻接矩阵提取自目标预测器的样本数据,在目标预测器训练成型之后,利用目标预测器预测事务时,邻接矩阵中的元素不再调整。
[0101]
第六全连接层输出的数据为第一预测内容,后续再反向优化时,根据第一内容与第一样本因变量之间的差异对初始预测器进行反向优化。
[0102]
在一个可选实施例中,所述第一数据关系为:
[0103]
h1(i)=σ1[h1
(i-1)
w1(i)+b(i)]
[0104]
其中,h1(i)表示第i层的输出数据;h1
(i-1)
表示第i-1层的输出数据;w1(i)表示第i层的第一权重,b(i)表示第i层的偏置参数;σ1(x)表示x的第一激活函数。
[0105]
其中,结合图2,以输入数据至输出数据的方向为正方向,对每个层(全连接层以及图卷积层)顺次编号,则i可以为3或4;当i=1时,也就是第四全连接层(或目标预测器中的第一全连接层),h1
(1)
=x,x为输入数据;以i为3为例,其中,h1
(3)
=σ1[h1
(2)
w1
(3)
+b
(3)
],该层的特征值(即输出数据)为h1
(3)

[0106]
w1(i)表示第i层的第一权重,b(i)表示第i层的偏置参数;在预测器(初始预测器和目标预测器)中,w1(i)、b(i)在每一层可相同也可不同;在同一层的不同通道中,也可采用不同的w1(i),以及不同的b(i)。在初始预测器中,可为每个w1(i)、b(i)随机设定初始数值,在预测器训练过程中,通过反向优化不断地对二者的数值进行调整,以得到全局优化的结果,即使得全局的损失函数最小的数值作为二者的最终数值。
[0107]
σ1(x)表示x的第一激活函数,也就是说,σ1[h1
(i-1)
w1(i)+b(i)]表示[h1
(i-1)
w1(i)+b(i)]的激活函数,可选地,激活函数可以是线性整流函数(rectified linear unit,relu)函数。
[0108]
在一个可选实施例中,步骤1212中,所述在所述初始预测器的初始图卷积层,根据第二数据关系,计算输出数据的步骤,包括:
[0109]
在所述图卷积层,生成所述第一训练样本的第一样本因变量的邻接矩阵;
[0110]
根据所述邻接矩阵以及第二数据关系,计算输出数据;
[0111]
所述第二数据关系为:
[0112][0113]
其中,h2(i)表示第i层的输出数据,结合图2,以输入数据至输出数据的方向为正方向,对每个层(全连接层以及图卷积层)顺次编号,则i为2。
[0114]
h2
(i-1)
表示第i-1层的输出数据,即第四全连接层(或第一全连接层)的输出数据,即h1
(1)

[0115]
w(i)表示第i层的权重,w(i)即w
(2)
,在预测器训练过程中,通过反向优化不断地对w
(2)
的数值进行调整,以得到全局优化的结果,即使得全局的损失函数最小的数值作为w
(2)
的最终数值;
[0116]
σ2(x)表示x的第二激活函数,即的激活函数,可选地,激活函数可以是relu函数;其中,σ2(x)与σ1(x)可以采用同一个激活函数,也可以采用不同的,本技术实施例在此不做限定。
[0117]
a表示所述邻接矩阵,其中,表示带有自连接的邻接矩阵,iq表示q*q的单位矩阵;q为图卷积层的结点数目,q=n,即结点数目与上述通道数目相同,都为因变量的数目。
[0118]
d表示a的度矩阵,度矩阵即度量矩阵,使得a可进行矩阵化操作。
[0119]
的左乘和右乘用于对邻接矩阵进行标准化处理。
[0120]
在一个可选实施例中,所述生成所述第一训练样本的第一样本因变量的邻接矩阵的步骤,包括:
[0121]
根据所述第一样本因变量以及第三数据关系,生成所述第一样本因变量的邻接矩阵;
[0122]
所述第三数据关系为:
[0123][0124]
s.t.a=a
t
[0125]aii
=0,a
ij
≥0,(i,j=1,2,
……
,q)
[0126]
其中,q表示所述图卷积层中的所述结点的个数;q=n,即结点数目与上述通道数目相同,都为因变量的数目。
[0127]
a表示所述邻接矩阵;a
t
表示a的转置矩阵;
[0128]
表示(y
train-y
train
a)2的第二范数,范数是具有长度概念的函数,用于度量矩阵空间中的中的元素大小。
[0129]
‖a‖1表示a的第一范数;λ为预设平系数。本技术实施例中,第一范数指l1范数,为矩阵中各个元素绝对值之和;第二范围为l2范数,指对矩阵中的总平方和求平方根,总平方和为各元素的平方和。
[0130]
第三数据关系为建立邻接矩阵的目标函数,在图结构的构造过程中,采用稀疏编码方式学习多因变量之间的稀疏表示,得到邻接矩阵,从而使得图结构中的边能够描述结点间的相关性强弱。表示第一样本因变量矩阵通过邻接矩阵尽a可能重构自身,加上邻接矩阵a对角线元素为零的约束条件,使得邻接矩阵a中每一列的元素能够表示其他因变量对某一因变量的构造关系,以用于描述多因变量之间的相关关系。
[0131]
除此之外,为了避免在后续邻接矩阵标准化过程中,正负相关关系的抵消影响标准化效果,因而假设多因变量之间的相关关系对称且非负,‖a‖1范数项能够压缩邻接矩阵中部分较小元素至零,使得邻接矩阵变得稀疏。可选地,上述目标函数可通过凸优化方法进行求解,本技术实施例在此不再赘述。
[0132]
在构造邻接矩阵的过程中,通过稀疏编码学习得到图结构,以及设计多通道的图卷积网络结构,有效利用多因变量间的相关性信息,提升模型在某些预测性能不佳的因变量上的表现以及软测量的综合性能。
[0133]
在一个可选实施例中,训练预测器的过程,需要计算预测器的损失值,步骤122包括:
[0134]
根据所述第一预测内容、所述第一训练样本的第一样本因变量以及第四数据关系,计算所述优化预测器的损失值,所述第四数据关系为:
[0135][0136]
其中,第四数据关系目标预测器训练过程的损失函数,以训练优化预测器为例,表示所述优化预测器的损失值,即实际因变量与预测因变量之间的差异,y1表示所述第一样本因变量,表示所述第一预测内容;p表示所述第一样本因变量的个
数,m表示所述第一训练样本的数目,在计算损失函数时,统计所有训练样本的差异,在后期对预测器进行反向优化的过程中,调整预测器每层的特征提取数据关系中的参数,以使损失函数的值最小,即实际值与预测值之间的差异最小,提升目标预测器的预测准确率;γ表示预设平衡系数;w3表示所述优化预测器的图卷积层的正则项,为图卷积层的第二范数,即图卷积层的特征矩阵中的总平方和的平方根,用于避免目标预测器的过于拟合。
[0137]
在一个可选实施例中,通过测试样本对待测试预测器进行测试,步骤13包括:
[0138]
将每个所述测试样本的第二样本自变量输入至所述待测试预测器,得到第二预测内容;
[0139]
根据所述测试样本的第二样本因变量以及第二预测内容,确定所述待测试预测器的回归参数;回归参数即回归系数,用于表示自变量对因变量影响大小;根据第二样本因变量以及第二预测内容之间的差异,确定回归参数。
[0140]
若所述回归参数满足第三预设要求,确定所述待测试预测器为目标预测器。回归参数中可能包括多个类型的参数,第三预设要求中包括对每个参数的具体要求;具体地,在一个可选实施例中,根据所述测试样本的第二样本因变量以及第二预测内容,确定所述待测试预测器的回归参数的步骤,包括:第一步以及第二步,需要说明的是,第一步与第二步可同步执行。
[0141]
第一步,根据所述测试样本的第二样本因变量、第二预测内容以及第五数据关系,确定所述待测试预测器的第一回归参数,所述第五数据关系为:
[0142][0143]
其中,r2表示第一回归参数,n表示所述测试样本的数目,y2表示所述第二样本因变量,表示所述第二预测内容,表示所述第二样本因变量的均值;r2即决定系数,将第二预测内容跟与第二样本因变量的均值相比的情况下,通过r2来比对差异,决定系数反应了因变量的波动有多少百分比能被自变量的波动所解释,取值范围通常在0至1之间;r2越大,自变量对因变量的解释程度越高,表示当前待测试预测器的性能越好;因此,第三预设要求中可包括r2的最低阈值,当r2大于或等于该阈值时,预测器满足第三预设要求。
[0144]
第二步,根据所述测试样本的第二样本因变量、第二预测内容以及第五数据关系,确定所述待测试预测器的第二回归参数,所述第六数据关系为:
[0145][0146]
其中,rmse表示第二回归参数,rmse为均方根误差,将第二预测内容与第二样本因变量的差异先平方,再求均值,最终再开平方;rmse数值越小,表示待测试预测器的性能越好,预测的差异越低。
[0147]
结合所述第一示例,以炼钢为例,自变量包括合金加入量、过程变量、钢水相关数据等参数;而因变量为终点元素含量,终点元素例如酸溶铝(als)、碳(c)、铬(cr)、钼(mo)等;由于终点元素含量难以直接测量和控制,且终点元素之间部分元素会互相影响,基于自
变量进行预测得到因变量。结合表1与表2,分别为本技术实施例中的目标预测器在一实施例的实际预测结果与其他预测取模的结果对比,表1的评价指标为r2,表2的评价指标为rmse;其中,带有(x)标识的表格为对应的终点元素的最佳预测表现。
[0148]
其他预测模型包括现有技术中的偏最小二乘模型、支持向量回归模型、全连接网络模型、极限学习机模型、图卷积网络模型,最后一列为本技术实施例中的目标预测器。
[0149]
表1:
[0150]
[0151][0152]
表2:
[0153]
[0154][0155]
基于表1与表2可知,大部分元素在本技术实施例中的目标预测器评价指标最优,同时在平均结果和平均排名方面,本技术实施例中的目标预测器明显优于其他对比模型;除此之外,由于在目标预测器建立过程中考虑了多因变量间的相关关系,目标预测器在元素als、p、v上的预测性能均明显优于其他元素,能够利用预测表现较好元素所提取的特征帮助预测性能不佳的元素,因此在这三种元素上均取得了最佳的表现,即使在个别元素上的表现并非最佳,在综合表现上相比于其他模型也有一定的性能提升。
[0156]
本技术上述实施例中,获取目标事务的待预测数据,将所述待预测数据输入至目标预测器,得到预测结果;预测结果中包括至少两个因变量,且所述目标预测器包括图卷积层,所述图卷积层为以多因变量为结点的图结构,图结构中利用图卷积运算将具有相关关系的因变量相互连接,使不同因变量在预测过程相互影响;基于因变量之间的耦合关系,提升目标预测器在一些预测性能不佳的因变量上的表现,提高多因变量预测的综合软测量性能,提升预测准确率。
[0157]
在上述各实施例的基础上,本技术实施例还提供了一种数据处理方法,多因变量的预测过程中,通过图卷积层挖掘相关变量之间的相互关系;基于以多因变量为结点的图结构,采用图卷积运算将具有相关关系的结点相连接,使不同因变量在预测过程相互影响,
以提高多因变量预测的综合软测量性能。
[0158]
参照图3,示出了本技术实施例的一种数据处理方法实施例的步骤流程图,所述方法包括:
[0159]
步骤301,获取目标事务的待预测数据;所述目标事务包括根据所述待预测数据执行的生产事务或参数预测事务。
[0160]
目标事务可以是工业生产事务,例如炼钢;随着自动化技术的不断进步,现代工业已开始逐步进入全自动化生产阶段。在工业生产中,得益于自动化技术中闭环反馈控制的核心思想,可通过对工业生产中的被控变量进行感知,从而调控生产过程,以有效克服生产过程中的扰动,实现生产过程的自动化控制。
[0161]
目标事务还可以是其他预测事务,例如温度预测,污水污染预测等。待预测数据为预测过程的自变量,通常为容易直接测量的变量,根据待测数据预测因变量。因变量即预测结果,通常为难以预测的变量。
[0162]
作为第一示例,目标事务为炼钢,则自变量包括合金加入量、过程变量、钢水相关数据等参数;合金加入量即各个合金的加入量;过程变量例如温度、时间等变量。而因变量为终点元素含量,终点元素例如酸溶铝(als)、碳(c)、铬(cr)、钼(mo)等;由于终点元素含量难以直接测量和控制,且终点元素之间部分元素会互相影响,基于自变量进行预测得到因变量。
[0163]
作为第二示例,目标事务为温度预测事务,自变量包括湿度百分比、露点温度、风速、云层覆盖率等,以及采样温度值;因变量为目标预测时间段内每个单元时间的温度,例如目标预测时间段为1天,则因变量为一天中的每小时,而每小时的温度是有一定的关联性的,即因变量之间存在一定的耦合性。
[0164]
作为第三示例,目标事务为污水污染预测事务,自变量包括温度、流量、酸碱度、溶解氧浓度、氧化还原电位、浊度和电导率等变量;因变量包括化学需氧量(chemical oxygen demand,cod)、硝酸盐、磷酸盐浓度等,各因变量检测耗时较长,且流程复杂;因此,通过自变量预测因变量。
[0165]
步骤302,将所述待预测数据输入至目标预测器,得到预测结果;其中,所述预测结果包括至少两个因变量;所述待预测数据包括所述因变量的自变量;
[0166]
所述目标预测器包括图卷积层,所述图卷积层包括根据样本数据训练得到的图结构,所述图结构的结点包括所述样本数据中的样本因变量。
[0167]
其中,预测结果中包括至少两个因变量,也即本技术实施例为多因变量预测过程,而多因变量在实际生产应用过程中,若存在一定的相关性,则会相互影响。
[0168]
针对引入多因变量间的相关性信息,图卷积网络是近年来发展迅速的一种用于挖掘图结构中相互关系的机器学习模型。本技术实施例中,目标预测器为预先训练的预测器,在训练过程中引入多因变量之间的相关性信息,所述目标预测器包括图卷积层,所述图卷积层包括根据样本数据训练得到的图结构,所述图结构的结点包括所述样本数据中的样本因变量,样本因变量即样本数据中的因变量,即已知的因变量值;样本数据中,每组数据包括样本自变量和样本因变量;将样本自变量输入至预测器得到预测因变量,然后根据已知的样本因变量与预测因变量的差距对预测器进行反向优化,最终得到满足精确度要求的预测器即为所述目标预测器。
[0169]
图卷积网络以其能够方便地在非欧式空间中进行运算的优势,在社交网络关系分析、文件分类、交通预测等领域得到了广泛的应用。图卷积层为以样本因变量为结点的图结构,图结构通常由结点和边组成,结点间的相互关系由边来描述。如图1所示,图1中每个结点n对应图卷积层的一个特征,相邻结点n之间的边表示两个相邻结点的相互关系。可以理解的是,图1仅对图卷积层进行示意,实际结点数量不一定以图1中所示为准。通过图卷积运算,将每个结点的相邻结点特征的加权求和作为该结点的特征;因此通过图卷积运算,能够基于图结构下所描述的相互关系来提取结点的特征。
[0170]
待预测数据作为输入数据输入目标预测器之后,经过图卷积层进行特征提取,得到作为预测结果的输出数据;如图1所示,输出数据中包括n个因变量,每个因变量对应一个通道,在图卷积层,每个具有相互关系的因变量的通道相连接,使得图卷积层在进行特征提取时,参考这种相互关系,使得多因变量之间的相互关系对预测结果产生影响。
[0171]
现有技术中,图卷积网络通常将样本视为结点,挖掘样本之间的相互关系,而挖掘非变量之间的相互关系,因此无法有效引入多因变量间的相关性信息;而本技术实施例中,针对具有多因变量的工业软测量场景,引入多因变量间的相关性信息,从而实现预测性能的提升。
[0172]
除此之外,现有技术中的图卷积网络,结点间的相互关系通常采用距离度量指标来计算,距离并不能很准确地描述结点之间的相关性信息。而本技术实施例中,目标预测器中每个通道可利用自变量信息独立地学习不同的因变量,同时多因变量分别作为图卷积层中的不同结点,通过图卷积层中的边来描述结点之间的相关性强弱,准确地衡量结点之间的相关性。
[0173]
参考上述第一示例,以炼钢为例,自变量包括合金加入量、过程变量、钢水相关数据等;将自变量输入至目标预测器,目标预测器对自变量进行特征提取,通过目标预测器的图卷积层,将各个因变量之间的相关关系融合在预测过程中,得到作为预测结果的因变量;因变量为终点元素含量,终点元素例如酸溶铝(als)。元素例如碳(c)、铬(cr)、钼(mo)等,预测结果中,包括每个终点元素的含量;由于目标预测器为预先经过训练的预测器,其精确度满足预设的精确度需求,因此基于目标预测器预测的终点元素含量的精确度也较高。
[0174]
在一个可选实施例中,所述目标预测器还包括目标全连接层,所述目标全连接层包括第一全连接层、第二全连接层以及第三全连接层;
[0175]
其中,所述第一全连接层、所述图卷积层、所述第二全连接层以及所述第三全连接层依次连接;
[0176]
每一层对输入数据进行特征提取,所提取的特征为输出数据;
[0177]
前一层的输出数据为后一层的输入数据;
[0178]
所述第一全连接层的输入数据为所述待预测数据,所述第三全连接层的输出数据为所述预测结果。
[0179]
在一个可选实施例中,每个所述目标全连接层包括n个通道,n为所述因变量的数目,所述通道对一个所述因变量进行处理。
[0180]
在一个可选实施例中,所述图结构中,每个所述结点的特征值为对相邻结点加权求和的结果;
[0181]
所述图结构中的权重为每相邻的两个所述结点之间的权重。
[0182]
所述权重为邻接矩阵中的元素,所述邻接矩阵为根据所述样本因变量生成的。
[0183]
在一个可选实施例中,所述获取目标事务的待预测数据的步骤之前,所述方法包括:
[0184]
获取所述样本数据;其中,所述样本数据包括训练样本以及测试样本;
[0185]
根据所述训练样本,训练初始预测器,得到待测试预测器;
[0186]
根据所述测试样本,对所述待测试预测器进行测试,得到所述目标预测器。
[0187]
在一个可选实施例中,所述样本数据中的样本包括样本自变量以及所述样本因变量;
[0188]
所述根据所述训练样本,训练初始预测器,得到待测试预测器的步骤,包括:
[0189]
将所述训练样本中的第一训练样本的第一样本自变量输入初始预测器,得到第一预测内容;
[0190]
根据所述第一预测内容与所述第一训练样本的第一样本因变量,对所述初始预测器进行反向优化,得到优化预测器;
[0191]
将所述训练样本中的第二样本自变量迭代输入所述优化预测器,并进行所述反向优化,至迭代次数满足第一预设要求和/或损失函数满足第二预设要求,得到待测试预测器。
[0192]
在一个可选实施例中,所述初始预测器包括初始全连接层以及初始图卷积层;每个所述初始全连接层包括n个通道;
[0193]
所述初始全连接层包括第四全连接层、第五全连接层以及第六全连接层;
[0194]
其中,所述第四全连接层、所述初始图卷积层、所述第五全连接层以及所述第六全连接层依次连接,每一层对输入数据进行特征提取,所提取的特征为输出数据;前一层的输出数据为后一层的输入数据。
[0195]
在一个可选实施例中,所述将所述训练样本中的第一训练样本的第一样本自变量输入初始预测器,得到第一预测内容的步骤,包括:
[0196]
将所述训练样本中的第一训练样本的第一样本自变量输入初始预测器;
[0197]
在每个所述初始预测器的初始全连接层,根据第一数据关系,计算输出数据;以及在所述初始预测器的初始图卷积层,根据第二数据关系,计算输出数据;
[0198]
获取所述第六全连接层的输出数据,作为第一预测内容。
[0199]
在一个可选实施例中,所述第一数据关系为:
[0200]
h1(i)=σ1[h1
(i-1)
w1(i)+b(i)]
[0201]
其中,h1(i)表示第i层的输出数据;h1
(i-1)
表示第i-1层的输出数据;w1(i)表示第i层的第一权重,b(i)表示第i层的偏置参数;σ1(x)表示x的第一激活函数。
[0202]
在一个可选实施例中,所述在所述初始预测器的初始图卷积层,根据第二数据关系,计算输出数据的步骤,包括:
[0203]
在所述图卷积层,生成所述第一训练样本的第一样本因变量的邻接矩阵;
[0204]
根据所述邻接矩阵以及第二数据关系,计算输出数据;
[0205]
所述第二数据关系为:
[0206]
[0207]
其中,h2(i)表示第i层的输出数据;h2
(i-1)
表示第i-1层的输出数据;w(i)表示第i层的权重;σ2(x)表示x的第二激活函数;
[0208]
a表示所述邻接矩阵,d表示a的度矩阵;
[0209]
w2(i)表示第i层的第二权重。
[0210]
在一个可选实施例中,所述生成所述第一训练样本的第一样本因变量的邻接矩阵的步骤,包括:
[0211]
根据所述第一样本因变量以及第三数据关系,生成所述第一样本因变量的邻接矩阵;
[0212]
所述第三数据关系为:
[0213][0214]
s.t.a=a
t
[0215]aii
=0,a
ij
≥0,(i,j=1,2,
……
,q)
[0216]
其中,q表示所述图卷积层中的所述结点的个数;
[0217]
a表示所述邻接矩阵;y
train
表示所述第一样本因变量;
[0218]
表示(y
train-y
train
a)2的第二范数;
[0219]
‖a‖1表示a的第一范数;λ为预设平系数。
[0220]
在一个可选实施例中,所述根据所述第一预测内容与所述第一训练样本的第一样本因变量,对所述初始预测器进行反向优化的步骤,所述方法包括:
[0221]
根据所述第一预测内容、所述第一训练样本的第一样本因变量以及第四数据关系,计算所述优化预测器的损失值,所述第四数据关系为:
[0222][0223]
其中,表示所述优化预测器的损失值,y1表示所述第一样本因变量,表示所述第一预测内容,p表示所述第一样本因变量的个数,m表示所述第一训练样本的数目;γ表示预设平衡系数;w3表示所述优化预测器的图卷积层的正则项。
[0224]
在一个可选实施例中,所述根据所述测试样本,对所述待测试预测器进行测试,得到所述目标预测器的步骤,包括:
[0225]
将每个所述测试样本的第二样本自变量输入至所述待测试预测器,得到第二预测内容;
[0226]
根据所述测试样本的第二样本因变量以及第二预测内容,确定所述待测试预测器的回归参数;
[0227]
若所述回归参数满足第三预设要求,确定所述待测试预测器为目标预测器。
[0228]
在一个可选实施例中,根据所述测试样本的第二样本因变量以及第二预测内容,确定所述待测试预测器的回归参数的步骤,包括:
[0229]
根据所述测试样本的第二样本因变量、第二预测内容以及第五数据关系,确定所述待测试预测器的第一回归参数,所述第五数据关系为:
[0230][0231]
其中,r2表示第一回归参数,n表示所述测试样本的数目,y2表示所述第二样本因变量,表示所述第二预测内容,表示所述第二样本因变量的均值;
[0232]
以及根据所述测试样本的第二样本因变量、第二预测内容以及第六数据关系,确定所述待测试预测器的第二回归参数,所述第六数据关系为:
[0233][0234]
其中,rmse表示第二回归参数。
[0235]
在一个可选实施例中,所述根据所述训练样本,训练初始预测器的步骤之前,所述方法还包括:
[0236]
对所述样本数据进行归一化处理。
[0237]
本技术上述实施例中,获取目标事务的待预测数据,将所述待预测数据输入至目标预测器,得到预测结果;预测结果中包括至少两个因变量,且所述目标预测器包括图卷积层,所述图卷积层为以多因变量为结点的图结构,图结构中利用图卷积运算将具有相关关系的因变量相互连接,使不同因变量在预测过程相互影响;基于因变量之间的耦合关系,提升目标预测器在一些预测性能不佳的因变量上的表现,提高多因变量预测的综合软测量性能,提升预测准确率。
[0238]
在上述各实施例的基础上,本技术实施例还提供了一种数据处理方法,在生产领域,对多因变量的预测过程中,通过图卷积层挖掘相关变量之间的相互关系;基于以多因变量为结点的图结构,采用图卷积运算将具有相关关系的结点相连接,使不同因变量在预测过程相互影响,以提高多因变量预测的综合软测量性能。
[0239]
参照图4,示出了本技术实施例的一种数据处理方法实施例的步骤流程图,所述方法包括:
[0240]
步骤401,获取目标生产事务的自变量数据;所述自变量数据包括起点元素加入量,或所述自变量数据包括起点元素加入量以及过程控制变量。
[0241]
随着自动化技术的不断进步,现代工业已开始逐步进入全自动化生产阶段。在工业生产中,得益于自动化技术中闭环反馈控制的核心思想,可通过对工业生产中的被控变量进行感知,从而调控生产过程,以有效克服生产过程中的扰动,实现生产过程的自动化控制。
[0242]
目标生产事务例如炼钢,起点元素加入量例如元素加入量、合金加入量;过程控制变量例如温度、时间等变量。而因变量为终点元素含量,终点元素例如酸溶铝(als)、碳(c)、铬(cr)、钼(mo)等;由于终点元素含量难以直接测量和控制,且终点元素之间部分元素会互相影响,基于自变量进行预测得到因变量。
[0243]
步骤402,将所述自变量数据输入至目标预测器,得到预测结果;其中,所述预测结果包括至少两个因变量;所述因变量包括终点元素含量;
[0244]
所述目标预测器包括图卷积层,所述图卷积层包括根据样本数据训练得到的图结构,所述图结构的结点包括所述样本数据中的样本因变量。
[0245]
其中,预测结果中包括至少两个因变量,也即本技术实施例为多因变量预测过程,而多因变量在实际生产应用过程中,若存在一定的相关性,则会相互影响。
[0246]
针对引入多因变量间的相关性信息,图卷积网络是近年来发展迅速的一种用于挖掘图结构中相互关系的机器学习模型。本技术实施例中,目标预测器为预先训练的预测器,在训练过程中引入多因变量之间的相关性信息,所述目标预测器包括图卷积层,所述图卷积层包括根据样本数据训练得到的图结构,所述图结构的结点包括所述样本数据中的样本因变量,样本因变量即样本数据中的因变量,即已知的因变量值;样本数据中,每组数据包括样本自变量和样本因变量;将样本自变量输入至预测器得到预测因变量,然后根据已知的样本因变量与预测因变量的差距对预测器进行反向优化,最终得到满足精确度要求的预测器即为所述目标预测器。
[0247]
图卷积网络以其能够方便地在非欧式空间中进行运算的优势,在社交网络关系分析、文件分类、交通预测等领域得到了广泛的应用。图卷积层为以样本因变量为结点的图结构,图结构通常由结点和边组成,结点间的相互关系由边来描述。如图1所示,图1中每个结点n对应图卷积层的一个特征,相邻结点n之间的边表示两个相邻结点的相互关系。可以理解的是,图1仅对图卷积层进行示意,实际结点数量不一定以图1中所示为准。通过图卷积运算,将每个结点的相邻结点特征的加权求和作为该结点的特征;因此通过图卷积运算,能够基于图结构下所描述的相互关系来提取结点的特征。
[0248]
自变量数据作为输入数据输入目标预测器之后,经过图卷积层进行特征提取,得到作为预测结果的输出数据;如图1所示,输出数据中包括n个因变量,每个因变量对应一个通道,在图卷积层,每个具有相互关系的因变量的通道相连接,使得图卷积层在进行特征提取时,参考这种相互关系,使得多因变量之间的相互关系对预测结果产生影响。
[0249]
现有技术中,图卷积网络通常将样本视为结点,挖掘样本之间的相互关系,而挖掘非变量之间的相互关系,因此无法有效引入多因变量间的相关性信息;而本技术实施例中,针对具有多因变量的工业软测量场景,引入多因变量间的相关性信息,从而实现预测性能的提升。
[0250]
除此之外,现有技术中的图卷积网络,结点间的相互关系通常采用距离度量指标来计算,距离并不能很准确地描述结点之间的相关性信息。而本技术实施例中,目标预测器中每个通道可利用自变量信息独立地学习不同的因变量,同时多因变量分别作为图卷积层中的不同结点,通过图卷积层中的边来描述结点之间的相关性强弱,准确地衡量结点之间的相关性。
[0251]
仍以炼钢为例,自变量包括合金加入量、过程变量、钢水相关数据等;将自变量输入至目标预测器,目标预测器对自变量进行特征提取,通过目标预测器的图卷积层,将各个因变量之间的相关关系融合在预测过程中,得到作为预测结果的因变量;因变量为终点元素含量,终点元素例如酸溶铝(als)。元素例如碳(c)、铬(cr)、钼(mo)等,预测结果中,包括每个终点元素的含量;由于目标预测器为预先经过训练的预测器,其精确度满足预设的精确度需求,因此基于目标预测器预测的终点元素含量的精确度也较高。
[0252]
在一个可选实施例中,所述得到预测结果的步骤之后,所述方法包括:
[0253]
根据所述预测结果的终点元素含量,调整所述自变量数据,比如,终点元素含量中某些元素含量与用户预期的有差距,则可朝向抵消这种差距的方向,调整自变量,比如调整一些起点元素含量或调整过程变量等。比如,用户可预先设定某个元素的目标终点含量,得到预测结果中的终点元素含量后,比较目标终点含量与预测结果中的终点元素含量的差距,然后随机或按照预先设定的调整规则,调整自变量,得到目标终点含量后,输出对应的自变量。
[0254]
本实施例的步骤与上述实施例类似,具体可参照上述实施例的描述。也就是说,步骤402之后,本实施例所提供的方法包括前述实施例中所提供方法中的其他步骤,本实施例在此不再赘述。
[0255]
本技术实施例中,获取目标生产事务的自变量数据,将所述自变量数据输入至目标预测器,得到预测结果;所述预测结果包括至少两个因变量;所述因变量包括终点元素含量,且所述目标预测器包括图卷积层,所述图卷积层为以多因变量为结点的图结构,图结构中利用图卷积运算将具有相关关系的因变量相互连接,使不同因变量在预测过程相互影响;基于因变量之间的耦合关系,提升目标预测器在一些预测性能不佳的因变量上的表现,提高多因变量预测的综合软测量性能,提升预测准确率。
[0256]
在上述各实施例的基础上,本技术实施例还提供了一种数据处理方法,在工业生产领域,对多个预测参数(生产结果)的预测过程中,通过图卷积层挖掘相关变量之间的相互关系;基于以多预测参数为结点的图结构,采用图卷积运算将具有相关关系的结点相连接,使不同预测参数(在预测过程相互影响,以提高多预测参数预测的综合软测量性能。
[0257]
参照图5,示出了本技术实施例的一种数据处理方法实施例的步骤流程图,所述方法包括:
[0258]
步骤501,获取工业生产事务的工业参数。
[0259]
随着自动化技术的不断进步,现代工业已开始逐步进入全自动化生产阶段。在工业生产中,得益于自动化技术中闭环反馈控制的核心思想,可通过对工业生产中的被控变量进行感知,从而调控生产过程,以有效克服生产过程中的扰动,实现生产过程的自动化控制。
[0260]
工业生产事务例如炼钢,比如工业参数包括起点元素加入量以及过程控制变量。起点元素加入量例如元素加入量、合金加入量;过程控制变量例如温度、时间等变量。而预测参数包括终点元素含量,终点元素例如酸溶铝(als)、碳(c)、铬(cr)、钼(mo)等;由于终点元素含量难以直接测量和控制,且终点元素之间部分元素会互相影响,基于工业参数进行预测得到预测参数。
[0261]
步骤502,将所述工业参数输入至目标预测器,得到预测结果;其中,所述预测结果包括至少两个预测参数;所述目标预测器包括图卷积层,所述图卷积层包括根据样本数据训练得到的图结构,所述图结构的结点包括所述样本数据中的样本预测参数。
[0262]
其中,预测结果中包括至少两个预测参数,也即本技术实施例为多预测参数预测过程,而多预测参数在实际生产应用过程中,若存在一定的相关性,则会相互影响。
[0263]
针对引入多预测参数间的相关性信息,图卷积网络是近年来发展迅速的一种用于挖掘图结构中相互关系的机器学习模型。本技术实施例中,目标预测器为预先训练的预测器,在训练过程中引入多预测参数之间的相关性信息,所述目标预测器包括图卷积层,所述
图卷积层包括根据样本数据训练得到的图结构,所述图结构的结点包括所述样本数据中的样本预测参数,样本预测参数即样本数据中的预测参数,即已知的预测参数值;样本数据中,每组数据包括样本工业参数和样本预测参数;将样本工业参数输入至预测器得到预测预测参数,然后根据已知的样本预测参数与预测预测参数的差距对预测器进行反向优化,最终得到满足精确度要求的预测器即为所述目标预测器。
[0264]
图卷积网络以其能够方便地在非欧式空间中进行运算的优势,在社交网络关系分析、文件分类、交通预测等领域得到了广泛的应用。图卷积层为以样本预测参数为结点的图结构,图结构通常由结点和边组成,结点间的相互关系由边来描述。如图1所示,图1中每个结点n对应图卷积层的一个特征,相邻结点n之间的边表示两个相邻结点的相互关系。可以理解的是,图1仅对图卷积层进行示意,实际结点数量不一定以图1中所示为准。通过图卷积运算,将每个结点的相邻结点特征的加权求和作为该结点的特征;因此通过图卷积运算,能够基于图结构下所描述的相互关系来提取结点的特征。
[0265]
工业参数作为输入数据输入目标预测器之后,经过图卷积层进行特征提取,得到作为预测结果的输出数据;如图1所示,输出数据中包括n个预测参数,每个预测参数对应一个通道,在图卷积层,每个具有相互关系的预测参数的通道相连接,使得图卷积层在进行特征提取时,参考这种相互关系,使得多预测参数之间的相互关系对预测结果产生影响。
[0266]
现有技术中,图卷积网络通常将样本视为结点,挖掘样本之间的相互关系,而挖掘非变量之间的相互关系,因此无法有效引入多预测参数间的相关性信息;而本技术实施例中,针对具有多预测参数的工业软测量场景,引入多预测参数间的相关性信息,从而实现预测性能的提升。
[0267]
除此之外,现有技术中的图卷积网络,结点间的相互关系通常采用距离度量指标来计算,距离并不能很准确地描述结点之间的相关性信息。而本技术实施例中,目标预测器中每个通道可利用工业参数信息独立地学习不同的预测参数,同时多预测参数分别作为图卷积层中的不同结点,通过图卷积层中的边来描述结点之间的相关性强弱,准确地衡量结点之间的相关性。
[0268]
仍以炼钢为例,工业参数包括合金加入量、过程变量、钢水相关数据等;将工业参数输入至目标预测器,目标预测器对工业参数进行特征提取,通过目标预测器的图卷积层,将各个预测参数之间的相关关系融合在预测过程中,得到作为预测结果的预测参数;预测参数为终点元素含量,终点元素例如酸溶铝(als)。元素例如碳(c)、铬(cr)、钼(mo)等,预测结果中,包括每个终点元素的含量;由于目标预测器为预先经过训练的预测器,其精确度满足预设的精确度需求,因此基于目标预测器预测的终点元素含量的精确度也较高。
[0269]
在一个可选实施例中,所述得到预测结果的步骤之后,所述方法包括:
[0270]
根据所述预测结果的终点元素含量,调整所述工业参数数据,比如,终点元素含量中某些元素含量与用户预期的有差距,则可朝向抵消这种差距的方向,调整工业参数,比如调整一些起点元素含量或调整过程变量等。比如,用户可预先设定某个元素的目标终点含量,得到预测结果中的终点元素含量后,比较目标终点含量与预测结果中的终点元素含量的差距,然后随机或按照预先设定的调整规则,调整工业参数,得到目标终点含量后,输出对应的工业参数。
[0271]
本实施例的步骤与上述实施例类似,具体可参照上述实施例的描述。也就是说,步
骤502之后,本实施例所提供的方法包括前述实施例中所提供方法中的其他步骤,本实施例在此不再赘述。
[0272]
本技术实施例中,获取工业生产事务的工业参数,将所述工业参数输入至目标预测器,得到预测结果;所述预测结果包括至少两个预测参数,且所述目标预测器包括图卷积层,所述图卷积层为以多预测参数为结点的图结构,图结构中利用图卷积运算将具有相关关系的预测参数相互连接,使不同预测参数在预测过程相互影响;基于预测参数之间的耦合关系,提升目标预测器在一些预测性能不佳的预测参数上的表现,提高多预测参数预测的综合软测量性能,提升预测准确率。
[0273]
在上述实施例的基础上,本实施例还提供了一种数据处理装置,应用于终端设备、服务器等电子设备中。
[0274]
参照图6,示出了本技术的一种数据处理装置实施例的结构框图,具体可以包括如下模块:
[0275]
数据获取模块601,用于获取目标事务的待预测数据;所述目标事务包括根据所述待预测数据执行的生产事务或参数预测事务。
[0276]
目标事务可以是工业生产事务,例如炼钢;随着自动化技术的不断进步,现代工业已开始逐步进入全自动化生产阶段。在工业生产中,得益于自动化技术中闭环反馈控制的核心思想,可通过对工业生产中的被控变量进行感知,从而调控生产过程,以有效克服生产过程中的扰动,实现生产过程的自动化控制。
[0277]
目标事务还可以是其他预测事务,例如温度预测,污水污染预测等。待预测数据为预测过程的自变量,通常为容易直接测量的变量,根据待测数据预测因变量。因变量即预测结果,通常为难以预测的变量。
[0278]
作为第一示例,目标事务为炼钢,则自变量包括合金加入量、过程变量、钢水相关数据等参数;合金加入量即各个合金的加入量;过程变量例如温度、时间等变量。而因变量为终点元素含量,终点元素例如酸溶铝(als)、碳(c)、铬(cr)、钼(05o)等;由于终点元素含量难以直接测量和控制,且终点元素之间部分元素会互相影响,基于自变量进行预测得到因变量。
[0279]
作为第二示例,目标事务为温度预测事务,自变量包括湿度百分比、露点温度、风速、云层覆盖率等,以及采样温度值;因变量为目标预测时间段内每个单元时间的温度,例如目标预测时间段为1天,则因变量为一天中的每小时,而每小时的温度是有一定的关联性的,即因变量之间存在一定的耦合性。
[0280]
作为第三示例,目标事务为污水污染预测事务,自变量包括温度、流量、酸碱度、溶解氧浓度、氧化还原电位、浊度和电导率等变量;因变量包括化学需氧量(chemical oxygen demand,cod)、硝酸盐、磷酸盐浓度等,各因变量检测耗时较长,且流程复杂;因此,通过自变量预测因变量。
[0281]
数据预测模块602,用于将所述待预测数据输入至目标预测器,得到预测结果;其中,所述预测结果包括至少两个因变量;所述待预测数据包括所述因变量的自变量;
[0282]
所述目标预测器包括图卷积层,所述图卷积层包括根据样本数据训练得到的图结构,所述图结构的结点包括所述样本数据中的样本因变量。
[0283]
其中,预测结果中包括至少两个因变量,也即本技术实施例为多因变量预测过程,
而多因变量在实际生产应用过程中,若存在一定的相关性,则会相互影响。
[0284]
针对引入多因变量间的相关性信息,图卷积网络是近年来发展迅速的一种用于挖掘图结构中相互关系的机器学习模型。本技术实施例中,目标预测器为预先训练的预测器,在训练过程中引入多因变量之间的相关性信息,所述目标预测器包括图卷积层,所述图卷积层包括根据样本数据训练得到的图结构,所述图结构的结点包括所述样本数据中的样本因变量,样本因变量即样本数据中的因变量,即已知的因变量值;样本数据中,每组数据包括样本自变量和样本因变量;将样本自变量输入至预测器得到预测因变量,然后根据已知的样本因变量与预测因变量的差距对预测器进行反向优化,最终得到满足精确度要求的预测器即为所述目标预测器。
[0285]
图卷积网络以其能够方便地在非欧式空间中进行运算的优势,在社交网络关系分析、文件分类、交通预测等领域得到了广泛的应用。图卷积层为以样本因变量为结点的图结构,图结构通常由结点和边组成,结点间的相互关系由边来描述。如图1所示,图1中每个结点n对应图卷积层的一个特征,相邻结点n之间的边表示两个相邻结点的相互关系。可以理解的是,图1仅对图卷积层进行示意,实际结点数量不一定以图1中所示为准。通过图卷积运算,将每个结点的相邻结点特征的加权求和作为该结点的特征;因此通过图卷积运算,能够基于图结构下所描述的相互关系来提取结点的特征。
[0286]
待预测数据作为输入数据输入目标预测器之后,经过图卷积层进行特征提取,得到作为预测结果的输出数据;如图1所示,输出数据中包括n个因变量,每个因变量对应一个通道,在图卷积层,每个具有相互关系的因变量的通道相连接,使得图卷积层在进行特征提取时,参考这种相互关系,使得多因变量之间的相互关系对预测结果产生影响。
[0287]
现有技术中,图卷积网络通常将样本视为结点,挖掘样本之间的相互关系,而挖掘非变量之间的相互关系,因此无法有效引入多因变量间的相关性信息;而本技术实施例中,针对具有多因变量的工业软测量场景,引入多因变量间的相关性信息,从而实现预测性能的提升。
[0288]
除此之外,现有技术中的图卷积网络,结点间的相互关系通常采用距离度量指标来计算,距离并不能很准确地描述结点之间的相关性信息。而本技术实施例中,目标预测器中每个通道可利用自变量信息独立地学习不同的因变量,同时多因变量分别作为图卷积层中的不同结点,通过图卷积层中的边来描述结点之间的相关性强弱,准确地衡量结点之间的相关性。
[0289]
参考上述第一示例,以炼钢为例,自变量包括合金加入量、过程变量、钢水相关数据等;将自变量输入至目标预测器,目标预测器对自变量进行特征提取,通过目标预测器的图卷积层,将各个因变量之间的相关关系融合在预测过程中,得到作为预测结果的因变量;因变量为终点元素含量,终点元素例如酸溶铝(als)。元素例如碳(c)、铬(cr)、钼(mo)等,预测结果中,包括每个终点元素的含量;由于目标预测器为预先经过训练的预测器,其精确度满足预设的精确度需求,因此基于目标预测器预测的终点元素含量的精确度也较高。
[0290]
在一个可选实施例中,所述目标预测器还包括目标全连接层,所述目标全连接层包括第一全连接层、第二全连接层以及第三全连接层;
[0291]
其中,所述第一全连接层、所述图卷积层、所述第二全连接层以及所述第三全连接层依次连接;
[0292]
每一层对输入数据进行特征提取,所提取的特征为输出数据;
[0293]
前一层的输出数据为后一层的输入数据;
[0294]
所述第一全连接层的输入数据为所述待预测数据,所述第三全连接层的输出数据为所述预测结果。
[0295]
在一个可选实施例中,每个所述目标全连接层包括n个通道,n为所述因变量的数目,所述通道对一个所述因变量进行处理。
[0296]
在一个可选实施例中,所述图结构中,每个所述结点的特征值为对相邻结点加权求和的结果;
[0297]
所述图结构中的权重为每相邻的两个所述结点之间的权重。
[0298]
所述权重为邻接矩阵中的元素,所述邻接矩阵为根据所述样本因变量生成的。
[0299]
参见图6,在一个可选实施例中,所述装置包括:
[0300]
样本数据获取模块603,用于获取所述样本数据;其中,所述样本数据包括训练样本以及测试样本;
[0301]
预测器训练模块604,用于根据所述训练样本,训练初始预测器,得到待测试预测器;
[0302]
预测器测试模块605,用于根据所述测试样本,对所述待测试预测器进行测试,得到所述目标预测器。
[0303]
在一个可选实施例中,所述样本数据中的样本包括样本自变量以及所述样本因变量;
[0304]
参见图6,所述预测器训练模块604包括:
[0305]
第一输入子模块6041,用于将所述训练样本中的第一训练样本的第一样本自变量输入初始预测器,得到第一预测内容;
[0306]
优化子模块6042,用于根据所述第一预测内容与所述第一训练样本的第一样本因变量,对所述初始预测器进行反向优化,得到优化预测器;
[0307]
迭代处理子模块6043,用于将所述训练样本中的第二样本自变量迭代输入所述优化预测器,并进行所述反向优化,至迭代次数满足第一预设要求和/或损失函数满足第二预设要求,得到待测试预测器。
[0308]
在一个可选实施例中,所述初始预测器包括初始全连接层以及初始图卷积层;每个所述初始全连接层包括n个通道;
[0309]
所述初始全连接层包括第四全连接层、第五全连接层以及第六全连接层;
[0310]
其中,所述第四全连接层、所述初始图卷积层、所述第五全连接层以及所述第六全连接层依次连接,每一层对输入数据进行特征提取,所提取的特征为输出数据;前一层的输出数据为后一层的输入数据。
[0311]
参见图6,在一个可选实施例中,所述第一输入子模块6041包括:
[0312]
输入单元,用于将所述训练样本中的第一训练样本的第一样本自变量输入初始预测器;
[0313]
计算单元,用于在每个所述初始预测器的初始全连接层,根据第一数据关系,计算输出数据;以及在所述初始预测器的初始图卷积层,根据第二数据关系,计算输出数据;
[0314]
获取单元,用于获取所述第六全连接层的输出数据,作为第一预测内容。
[0315]
在一个可选实施例中,所述第一数据关系为:
[0316]
h1(i)=σ1[h1
(i-1)
w1(i)+b(i)]
[0317]
其中,h1(i)表示第i层的输出数据;h1
(i-1)
表示第i-1层的输出数据;w1(i)表示第i层的第一权重,b(i)表示第i层的偏置参数;σ1(x)表示x的第一激活函数。
[0318]
在一个可选实施例中,所述计算单元用于:
[0319]
在所述图卷积层,生成所述第一训练样本的第一样本因变量的邻接矩阵;
[0320]
根据所述邻接矩阵以及第二数据关系,计算输出数据;
[0321]
所述第二数据关系为:
[0322][0323]
其中,h2(i)表示第i层的输出数据;h2
(i-1)
表示第i-1层的输出数据;w(i)表示第i层的权重;σ2(x)表示x的第二激活函数;
[0324]
a表示所述邻接矩阵,d表示a的度矩阵;
[0325]
w2(i)表示第i层的第二权重。
[0326]
在一个可选实施例中,所述计算单元用于:
[0327]
根据所述第一样本因变量以及第三数据关系,生成所述第一样本因变量的邻接矩阵;
[0328]
所述第三数据关系为:
[0329][0330]
s.t.a=a
t
[0331]aii
=0,a
ij
≥0,(i,j=1,2,
……
,q)
[0332]
其中,q表示所述图卷积层中的所述结点的个数;
[0333]
a表示所述邻接矩阵;y
train
表示所述第一样本因变量;
[0334]
表示(y
train-y
train
a)2的第二范数;
[0335]
‖a‖1表示a的第一范数;λ为预设平系数。
[0336]
在一个可选实施例中,所述优化子模块6042用于:
[0337]
根据所述第一预测内容、所述第一训练样本的第一样本因变量以及第四数据关系,计算所述优化预测器的损失值,所述第四数据关系为:
[0338][0339]
其中,表示所述优化预测器的损失值,y1表示所述第一样本因变量,表示所述第一预测内容,p表示所述第一样本因变量的个数,05表示所述第一训练样本的数目;γ表示预设平衡系数;w3表示所述优化预测器的图卷积层的正则项。
[0340]
参见图6,在一个可选实施例中,所述预测器测试模块605包括:
[0341]
第二输入子模块6051,用于将每个所述测试样本的第二样本自变量输入至所述待测试预测器,得到第二预测内容;
[0342]
第一确定子模块6052,用于根据所述测试样本的第二样本因变量以及第二预测内容,确定所述待测试预测器的回归参数;
[0343]
第二确定子模块6053,用于若所述回归参数满足第三预设要求,确定所述待测试预测器为目标预测器。
[0344]
在一个可选实施例中,根据第一确定子模块6052包括:
[0345]
第一确定单元,用于根据所述测试样本的第二样本因变量、第二预测内容以及第五数据关系,确定所述待测试预测器的第一回归参数,所述第五数据关系为:
[0346][0347]
其中,r2表示第一回归参数,n表示所述测试样本的数目,y2表示所述第二样本因变量,表示所述第二预测内容,表示所述第二样本因变量的均值;
[0348]
以及第二确定单元,用于根据所述测试样本的第二样本因变量、第二预测内容以及第五数据关系,确定所述待测试预测器的第二回归参数,所述第六数据关系为:
[0349][0350]
其中,rmse表示第二回归参数。
[0351]
参见图6,在一个可选实施例中,所述装置还包括:
[0352]
归一化处理模块606,用于对所述样本数据进行归一化处理。
[0353]
本技术上述实施例中,数据获取模块601获取目标事务的待预测数据,数据预测模块602将所述待预测数据输入至目标预测器,得到预测结果;预测结果中包括至少两个因变量,且所述目标预测器包括图卷积层,所述图卷积层为以多因变量为结点的图结构,图结构中利用图卷积运算将具有相关关系的因变量相互连接,使不同因变量在预测过程相互影响;基于因变量之间的耦合关系,提升目标预测器在一些预测性能不佳的因变量上的表现,提高多因变量预测的综合软测量性能,提升预测准确率。
[0354]
在上述实施例的基础上,本实施例还提供了一种数据处理装置,应用于终端设备、服务器等电子设备中。
[0355]
参照图8,示出了本技术的一种数据处理装置实施例的结构框图,具体可以包括如下模块:
[0356]
自变量数据获取模块801,用于获取目标生产事务的自变量数据;所述自变量数据包括起点元素加入量,或所述自变量数据包括起点元素加入量以及过程控制变量。
[0357]
随着自动化技术的不断进步,现代工业已开始逐步进入全自动化生产阶段。在工业生产中,得益于自动化技术中闭环反馈控制的核心思想,可通过对工业生产中的被控变量进行感知,从而调控生产过程,以有效克服生产过程中的扰动,实现生产过程的自动化控制。
[0358]
目标生产事务例如炼钢,起点元素加入量例如元素加入量、合金加入量;过程控制变量例如温度、时间等变量。而因变量为终点元素含量,终点元素例如酸溶铝(als)、碳(c)、
铬(cr)、钼(mo)等;由于终点元素含量难以直接测量和控制,且终点元素之间部分元素会互相影响,基于自变量进行预测得到因变量。
[0359]
自变量预测模块802,用于将所述自变量数据输入至目标预测器,得到预测结果;其中,所述预测结果包括至少两个因变量;所述因变量包括终点元素含量;
[0360]
所述目标预测器包括图卷积层,所述图卷积层包括根据样本数据训练得到的图结构,所述图结构的结点包括所述样本数据中的样本因变量。
[0361]
其中,预测结果中包括至少两个因变量,也即本技术实施例为多因变量预测过程,而多因变量在实际生产应用过程中,若存在一定的相关性,则会相互影响。
[0362]
针对引入多因变量间的相关性信息,图卷积网络是近年来发展迅速的一种用于挖掘图结构中相互关系的机器学习模型。本技术实施例中,目标预测器为预先训练的预测器,在训练过程中引入多因变量之间的相关性信息,所述目标预测器包括图卷积层,所述图卷积层包括根据样本数据训练得到的图结构,所述图结构的结点包括所述样本数据中的样本因变量,样本因变量即样本数据中的因变量,即已知的因变量值;样本数据中,每组数据包括样本自变量和样本因变量;将样本自变量输入至预测器得到预测因变量,然后根据已知的样本因变量与预测因变量的差距对预测器进行反向优化,最终得到满足精确度要求的预测器即为所述目标预测器。
[0363]
图卷积网络以其能够方便地在非欧式空间中进行运算的优势,在社交网络关系分析、文件分类、交通预测等领域得到了广泛的应用。图卷积层为以样本因变量为结点的图结构,图结构通常由结点和边组成,结点间的相互关系由边来描述。如图1所示,图1中每个结点n对应图卷积层的一个特征,相邻结点n之间的边表示两个相邻结点的相互关系。可以理解的是,图1仅对图卷积层进行示意,实际结点数量不一定以图1中所示为准。通过图卷积运算,将每个结点的相邻结点特征的加权求和作为该结点的特征;因此通过图卷积运算,能够基于图结构下所描述的相互关系来提取结点的特征。
[0364]
待预测数据作为输入数据输入目标预测器之后,经过图卷积层进行特征提取,得到作为预测结果的输出数据;如图1所示,输出数据中包括n个因变量,每个因变量对应一个通道,在图卷积层,每个具有相互关系的因变量的通道相连接,使得图卷积层在进行特征提取时,参考这种相互关系,使得多因变量之间的相互关系对预测结果产生影响。
[0365]
现有技术中,图卷积网络通常将样本视为结点,挖掘样本之间的相互关系,而挖掘非变量之间的相互关系,因此无法有效引入多因变量间的相关性信息;而本技术实施例中,针对具有多因变量的工业软测量场景,引入多因变量间的相关性信息,从而实现预测性能的提升。
[0366]
除此之外,现有技术中的图卷积网络,结点间的相互关系通常采用距离度量指标来计算,距离并不能很准确地描述结点之间的相关性信息。而本技术实施例中,目标预测器中每个通道可利用自变量信息独立地学习不同的因变量,同时多因变量分别作为图卷积层中的不同结点,通过图卷积层中的边来描述结点之间的相关性强弱,准确地衡量结点之间的相关性。
[0367]
仍以炼钢为例,自变量包括合金加入量、过程变量、钢水相关数据等;将自变量输入至目标预测器,目标预测器对自变量进行特征提取,通过目标预测器的图卷积层,将各个因变量之间的相关关系融合在预测过程中,得到作为预测结果的因变量;因变量为终点元
素含量,终点元素例如酸溶铝(als)。元素例如碳(c)、铬(cr)、钼(mo)等,预测结果中,包括每个终点元素的含量;由于目标预测器为预先经过训练的预测器,其精确度满足预设的精确度需求,因此基于目标预测器预测的终点元素含量的精确度也较高。
[0368]
在一个可选实施例中,所述装置还包括:
[0369]
调整模块,用于根据所述预测结果的终点元素含量,调整所述自变量数据。
[0370]
本实施例的包括的其他模块与上述实施例类似,具体可参照上述实施例的描述,本实施例在此不再赘述。
[0371]
本技术实施例中,自变量数据获取模块801获取目标生产事务的自变量数据,自变量预测模块802将所述自变量数据输入至目标预测器,得到预测结果;所述预测结果包括至少两个因变量;所述因变量包括终点元素含量,且所述目标预测器包括图卷积层,所述图卷积层为以多因变量为结点的图结构,图结构中利用图卷积运算将具有相关关系的因变量相互连接,使不同因变量在预测过程相互影响;基于因变量之间的耦合关系,提升目标预测器在一些预测性能不佳的因变量上的表现,提高多因变量预测的综合软测量性能,提升预测准确率。
[0372]
在上述实施例的基础上,本实施例还提供了一种数据处理装置,应用于终端设备、服务器等电子设备中。
[0373]
参照图9,示出了本技术的一种数据处理装置实施例的结构框图,具体可以包括如下模块:
[0374]
参数获取模块901,用于获取工业生产事务的工业参数。
[0375]
随着自动化技术的不断进步,现代工业已开始逐步进入全自动化生产阶段。在工业生产中,得益于自动化技术中闭环反馈控制的核心思想,可通过对工业生产中的被控变量进行感知,从而调控生产过程,以有效克服生产过程中的扰动,实现生产过程的自动化控制。
[0376]
工业生产事务例如炼钢,比如工业参数包括起点元素加入量以及过程控制变量。起点元素加入量例如元素加入量、合金加入量;过程控制变量例如温度、时间等变量。而预测参数包括终点元素含量,终点元素例如酸溶铝(als)、碳(c)、铬(cr)、钼(mo)等;由于终点元素含量难以直接测量和控制,且终点元素之间部分元素会互相影响,基于工业参数进行预测得到预测参数。
[0377]
参数预测模块902,用于将所述工业参数输入至目标预测器,得到预测结果;其中,所述预测结果包括至少两个预测参数;所述目标预测器包括图卷积层,所述图卷积层包括根据样本数据训练得到的图结构,所述图结构的结点包括所述样本数据中的样本预测参数。
[0378]
其中,预测结果中包括至少两个预测参数,也即本技术实施例为多预测参数预测过程,而多预测参数在实际生产应用过程中,若存在一定的相关性,则会相互影响。
[0379]
针对引入多预测参数间的相关性信息,图卷积网络是近年来发展迅速的一种用于挖掘图结构中相互关系的机器学习模型。本技术实施例中,目标预测器为预先训练的预测器,在训练过程中引入多预测参数之间的相关性信息,所述目标预测器包括图卷积层,所述图卷积层包括根据样本数据训练得到的图结构,所述图结构的结点包括所述样本数据中的样本预测参数,样本预测参数即样本数据中的预测参数,即已知的预测参数值;样本数据
中,每组数据包括样本工业参数和样本预测参数;将样本工业参数输入至预测器得到预测预测参数,然后根据已知的样本预测参数与预测预测参数的差距对预测器进行反向优化,最终得到满足精确度要求的预测器即为所述目标预测器。
[0380]
图卷积网络以其能够方便地在非欧式空间中进行运算的优势,在社交网络关系分析、文件分类、交通预测等领域得到了广泛的应用。图卷积层为以样本预测参数为结点的图结构,图结构通常由结点和边组成,结点间的相互关系由边来描述。如图1所示,图1中每个结点n对应图卷积层的一个特征,相邻结点n之间的边表示两个相邻结点的相互关系。可以理解的是,图1仅对图卷积层进行示意,实际结点数量不一定以图1中所示为准。通过图卷积运算,将每个结点的相邻结点特征的加权求和作为该结点的特征;因此通过图卷积运算,能够基于图结构下所描述的相互关系来提取结点的特征。
[0381]
工业参数作为输入数据输入目标预测器之后,经过图卷积层进行特征提取,得到作为预测结果的输出数据;如图1所示,输出数据中包括n个预测参数,每个预测参数对应一个通道,在图卷积层,每个具有相互关系的预测参数的通道相连接,使得图卷积层在进行特征提取时,参考这种相互关系,使得多预测参数之间的相互关系对预测结果产生影响。
[0382]
现有技术中,图卷积网络通常将样本视为结点,挖掘样本之间的相互关系,而挖掘非变量之间的相互关系,因此无法有效引入多预测参数间的相关性信息;而本技术实施例中,针对具有多预测参数的工业软测量场景,引入多预测参数间的相关性信息,从而实现预测性能的提升。
[0383]
除此之外,现有技术中的图卷积网络,结点间的相互关系通常采用距离度量指标来计算,距离并不能很准确地描述结点之间的相关性信息。而本技术实施例中,目标预测器中每个通道可利用工业参数信息独立地学习不同的预测参数,同时多预测参数分别作为图卷积层中的不同结点,通过图卷积层中的边来描述结点之间的相关性强弱,准确地衡量结点之间的相关性。
[0384]
仍以炼钢为例,工业参数包括合金加入量、过程变量、钢水相关数据等;将工业参数输入至目标预测器,目标预测器对工业参数进行特征提取,通过目标预测器的图卷积层,将各个预测参数之间的相关关系融合在预测过程中,得到作为预测结果的预测参数;预测参数为终点元素含量,终点元素例如酸溶铝(als)。元素例如碳(c)、铬(cr)、钼(mo)等,预测结果中,包括每个终点元素的含量;由于目标预测器为预先经过训练的预测器,其精确度满足预设的精确度需求,因此基于目标预测器预测的终点元素含量的精确度也较高。
[0385]
本技术实施例中,参数获取模块901获取工业生产事务的工业参数,参数预测模块902将所述工业参数输入至目标预测器,得到预测结果;所述预测结果包括至少两个预测参数,且所述目标预测器包括图卷积层,所述图卷积层为以多预测参数为结点的图结构,图结构中利用图卷积运算将具有相关关系的预测参数相互连接,使不同预测参数在预测过程相互影响;基于预测参数之间的耦合关系,提升目标预测器在一些预测性能不佳的预测参数上的表现,提高多预测参数预测的综合软测量性能,提升预测准确率。
[0386]
本技术实施例还提供了一种非易失性可读存储介质,该存储介质中存储有一个或多个模块(programs),该一个或多个模块被应用在设备时,可以使得该设备执行本技术实施例中各方法步骤的指令(instructions)。
[0387]
本技术实施例提供了一个或多个机器可读存储介质,其上存储有指令,当由一个
或多个处理器执行时,使得电子设备执行如上述实施例中一个或多个所述的方法。本技术实施例中,所述电子设备包括终端设备、服务器(集群)等各类型的设备。
[0388]
本公开的实施例可被实现为使用任意适当的硬件,固件,软件,或及其任意组合进行想要的配置的装置,该装置可包括终端设备、服务器(集群)等电子设备。图10示意性地示出了可被用于实现本技术中所述的各个实施例的示例性装置1000。
[0389]
对于一个实施例,图10示出了示例性装置1000,该装置具有一个或多个处理器1002、被耦合到(一个或多个)处理器1002中的至少一个的控制模块(芯片组)1004、被耦合到控制模块1004的存储器1006、被耦合到控制模块1004的非易失性存储器(nvm)/存储设备1008、被耦合到控制模块1004的一个或多个输入/输出设备1010,以及被耦合到控制模块1004的网络接口1012。
[0390]
处理器1002可包括一个或多个单核或多核处理器,处理器1002可包括通用处理器或专用处理器(例如图形处理器、应用处理器、基频处理器等)的任意组合。在一些实施例中,装置1000能够作为本技术实施例中所述终端设备、服务器(集群)等设备。
[0391]
在一些实施例中,装置1000可包括具有指令1014的一个或多个计算机可读介质(例如,存储器1006或nvm/存储设备1008)以及与该一个或多个计算机可读介质相合并被配置为执行指令1014以实现模块从而执行本公开中所述的动作的一个或多个处理器1002。
[0392]
对于一个实施例,控制模块1004可包括任意适当的接口控制器,以向(一个或多个)处理器1002中的至少一个和/或与控制模块1004通信的任意适当的设备或组件提供任意适当的接口。
[0393]
控制模块1004可包括存储器控制器模块,以向存储器1006提供接口。存储器控制器模块可以是硬件模块、软件模块和/或固件模块。
[0394]
存储器1006可被用于例如为装置1000加载和存储数据和/或指令1014。对于一个实施例,存储器1006可包括任意适当的易失性存储器,例如,适当的dram。在一些实施例中,存储器1006可包括双倍数据速率类型四同步动态随机存取存储器(ddr4sdram)。
[0395]
对于一个实施例,控制模块1004可包括一个或多个输入/输出控制器,以向nvm/存储设备1008及(一个或多个)输入/输出设备1010提供接口。
[0396]
例如,nvm/存储设备1008可被用于存储数据和/或指令1014。nvm/存储设备1008可包括任意适当的非易失性存储器(例如,闪存)和/或可包括任意适当的(一个或多个)非易失性存储设备(例如,一个或多个硬盘驱动器(hdd)、一个或多个光盘(cd)驱动器和/或一个或多个数字通用光盘(dvd)驱动器)。
[0397]
nvm/存储设备1008可包括在物理上作为装置1000被安装在其上的设备的一部分的存储资源,或者其可被该设备访问可不必作为该设备的一部分。例如,nvm/存储设备1008可通过网络经由(一个或多个)输入/输出设备1010进行访问。
[0398]
(一个或多个)输入/输出设备1010可为装置1000提供接口以与任意其他适当的设备通信,输入/输出设备1010可以包括通信组件、音频组件、传感器组件等。网络接口1012可为装置1000提供接口以通过一个或多个网络通信,装置1000可根据一个或多个无线网络标准和/或协议中的任意标准和/或协议来与无线网络的一个或多个组件进行无线通信,例如接入基于通信标准的无线网络,如wifi、2g、3g、4g、5g等,或它们的组合进行无线通信。
[0399]
对于一个实施例,(一个或多个)处理器1002中的至少一个可与控制模块1004的一
个或多个控制器(例如,存储器控制器模块)的逻辑封装在一起。对于一个实施例,(一个或多个)处理器1002中的至少一个可与控制模块1004的一个或多个控制器的逻辑封装在一起以形成系统级封装(sip)。对于一个实施例,(一个或多个)处理器1002中的至少一个可与控制模块1004的一个或多个控制器的逻辑集成在同一模具上。对于一个实施例,(一个或多个)处理器1002中的至少一个可与控制模块1004的一个或多个控制器的逻辑集成在同一模具上以形成片上系统(soc)。
[0400]
在各个实施例中,装置1000可以但不限于是:服务器、台式计算设备或移动计算设备(例如,膝上型计算设备、手持计算设备、平板电脑、上网本等)等终端设备。在各个实施例中,装置1000可具有更多或更少的组件和/或不同的架构。例如,在一些实施例中,装置1000包括一个或多个摄像机、键盘、液晶显示器(lcd)屏幕(包括触屏显示器)、非易失性存储器端口、多个天线、图形芯片、专用集成电路(asic)和扬声器。
[0401]
其中,检测装置中可采用主控芯片作为处理器或控制模块,传感器数据、位置信息等存储到存储器或nvm/存储设备中,传感器组可作为输入/输出设备,通信接口可包括网络接口。
[0402]
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
[0403]
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
[0404]
本技术实施例是参照根据本技术实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0405]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0406]
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0407]
尽管已描述了本技术实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本技术实施例范围的所有变更和修改。
[0408]
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意
在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
[0409]
以上对本技术所提供的一种数据处理方法和装置,一种电子设备和一种存储介质,进行了详细介绍,本文中应用了具体个例对本技术的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本技术的方法及其核心思想;同时,对于本领域的一般技术人员,依据本技术的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本技术的限制。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1