一种基于时序图网络的发酵过程软测量建模方法

文档序号:32565491发布日期:2022-12-16 19:04阅读:187来源:国知局
一种基于时序图网络的发酵过程软测量建模方法

1.本发明属于发酵过程软测量领域,具体涉及一种基于时序图网络的发酵过程软测量建模方法。


背景技术:

2.发酵过程是有生物参与并在合适的ph值、温度、搅拌等发酵条件下生成目标产物的过程,广泛的存在于各种工业过程中,有固有的强非线性和机理过程的复杂性。其理论建模和过程控制都存在较大困难,尤其是缺乏合适的在线传感器来在线分析关键产品质量,如青霉素发酵过程中的关键产品质量,只能偶尔以离线的方式进行分析,这在很大程度上限制了发酵过程的控制和优化。
3.随着数据驱动建模的方法在工业过程中体现出巨大优势,同时为了克服难以分析关键产品质量的问题,越来越多的人采用数据驱动建模的方法从其他可在线测量的变量中来估计关键产品质量。发酵过程由于其产品质量和操作变量之间存在强非线性,因此基于发酵过程的数据驱动建模方法主要分为统计方法、浅层机器学习方法和深度学习方法。其中,统计方法主要包括主成分分析(principal componentanalysis,pca)、偏最小二乘法(partial least squares,pls)。浅层机器学习方法是指深度学习以外的传统机器学习模型,包括浅层人工神经网络(artificial neural network,ann)、支持向量机(supportvectormachine,svm)、高斯过程模型(gaussian process model,gpm)。深度学习主要包括各种三层以上的深度神经网络,如长短期记忆(long short-term memory,lstm),深度神经网络已经被证明能够逼近任何非线性系统并广泛应用于过程建模中。
4.最近,图神经网络(graphneural network,gnn)作为深度学习的一个分支,在许多领域表现出优越的性能。作为传统gnn的一种变体,图卷积网络(graph convolution network,gcn)通过对结构数据进行卷积运算,体现了强大的表示能力。


技术实现要素:

5.针对现有技术中存在的上述问题,本发明的目的在于提供一种基于时序图网络的发酵过程软测量建模方法,能够提高发酵过程关键产品质量的预测效果。
6.本发明提供如下技术方案:一种基于时序图网络的发酵过程软测量建模方法,所述方法包括以下步骤:
7.(1)数据的获取和整合
8.使用仿真平台inpensim获取不同工况下的青霉素发酵过程,并且以一小时为一批次对数据进行划分、收集和整合。
9.(2)数据选择
10.根据格兰杰因果检测(granger causality test,gc test)对数据进行选择,去除冗余无用的数据并建立变量之间因果图。
11.(3)建模训练
12.构建基于时序图网络的发酵过程软测量建模方法的图长短期记忆 graphlstm(graph long short-term memory)算法模型,模型的输入为经过选择保留的数据与变量之间的因果连接矩阵;然后利用图长短期记忆graphlstm模型对所整合的数据进行学习训练。
13.(4)模型预测
14.将训练后的图长短期记忆graphlstm模型用于青霉素发酵过程产物出口浓度预测,并给出预测结果。
15.进一步,所述步骤(1)的过程为:
16.步骤1.1:设定inpensim仿真过程,获得仿真平台36个变量的输出数据。
17.步骤1.2:将数据根据3:2:1的比例划分成训练集、验证集和测试集。
18.步骤1.3:由于不同变量之间数据差异性较大,因此有必要对数据进行标准化处理,以便于模型进行处理和运算,具体公式如下所示:
[0019][0020]
其中,x’是经标准化处理后的数据,x是未经标准化处理的原数据,μ是数据的均值,σ是数据的标准差。
[0021]
进一步,所述步骤(2)的过程为:
[0022]
步骤2.1:使用格兰杰因果检测进行数据变量选择,首先可以建立两种不同的自回归模型来评估格兰杰因果关系:
[0023][0023][0024]
其中,a
1i,l
(i=1,2)和b
11,l
是自回归模型的系数;ε
1(t)
和ε
1(2)(t)
分别是完整模型和简化模型的预测误差;p是自回归模型的顺序,即模型所涉及的时间滞后;j是过程变量的总数,x
j(t)
(j=3,4,...,j)表示在第t个采样时间点第j个变量的观测值。
[0025]
步骤2.2:做出零假设h0:f
x2

x1
=0和备选假设h1:f
x2

x1
》0。如果拒绝零假设,则f检测意味着x2对x1存在格兰杰因果关系。可以采用如下定义的f统计来检验该假设:
[0026][0027]
其中r0和r1分别是公式(2)中两个模型的残差平方和,n是样本大小,p为置信边界。如果统计量大于从f分布得出的临界值,则拒绝零假设。
[0028]
步骤2.3:根据格兰杰因果检测的p值对变量进行排序完成变量选择过程。
[0029]
步骤2.4:根据格兰杰因果检测的p值建立变量之间的因果关系。
[0030]
进一步,所述步骤(3)的过程为:
[0031]
步骤3.1:图长短期记忆graphlstm是依托相关算法构建发酵过程出口浓度预测模型;图长短期记忆graphlstm主要基于图卷积网络(gcn)和长短期记忆(lstm)构建;gcn是一种在非欧空间上对数据进行卷积的算法。gcn可以表示为:
[0032]
[0033]
其中h为当前层特征向量,x
in
表示输入数据,w为权重矩阵,σ(.)为激活函数,表示输入的邻接矩阵,其中表示卷积核, d=∑
jaij
表示邻接矩阵a的度矩阵。
[0034]
对于序列建模而言,lstm的主要创新是本质上充当状态信息的累加器c
t
。该单元由几个参数化的控制门访问、写入和清除。每当一个新数据输入时,如果输入门被激活,它的信息将被累积到单元中。此外,如果遗忘门f
t
开启,则过去的单元状态c
t-1
可能会在此过程中被“遗忘”。最新的单元输出c
t
是否被传播到最终状态h
t
还由输出门 o
t
控制。lstm主要等式如下所示,其中表示哈达玛乘积:
[0035][0036]it
表示输入门的结果,f
t
表示忘记门的结果,c
t
表示内存单元在当前时刻的结果,o
t
表示输出门的结果,h
t
表示模块在当前时刻的输出结果,w
hi
、w
ci
、w
hf
、w
cf
、w
hc
、w
ho
、w
co
、和bi、bf、bc、bo分别表示可训练的卷积核和可训练的偏置。
[0037]
步骤3.2:lstm在处理时空数据方面的主要缺点是它在输入到状态和状态到状态的转换中使用全连接,没有对空间信息进行编码。为了克服这个问题,图长短期记忆graphlstm的一个显着特点是数据x 和邻接矩阵a一起输入模型。图长短期记忆graphlstm通过其节点邻居的输入和过去状态来对过程数据进行编码。图长短期记忆graphlstm的公式如下所示:
[0038][0039]
其中gcn(x,a)表示图卷积操作,其余变量与lstm一致。
[0040]
步骤3.3:使用训练数据训练图长短期记忆graphlstm,使用验证数据对图长短期记忆graphlstm进行超参数选择,最后得到训练后的图长短期记忆graphlstm模型。
[0041]
进一步,所述步骤(4)的过程为:
[0042]
步骤4.1:将测试数据输入训练后的图长短期记忆graphlstm模型。使用均方误差(rmse)作为评估指标,计算公式如下:
[0043][0044]
其中,表示真实数据,yi表示模型的输出,n表示测试集包含样本个数。一般来说,rmse越小,意味着模型的预测值与真实值越接近,即模型的预测效果越好。
[0045]
本发明的有益效果主要表现在:本发明提出了一种基于时序图网络的发酵过程软测量建模方法,提高了发酵过程关键产品质量的预测准确度;本方法利用图卷积网络和长短期记忆,在时间和空间维度上对数据进行提取,增加了模型的泛化性;本方法可以对不同发酵过程的关键产品质量进行精准测量。
附图说明
[0046]
图1是本发明的图长短期记忆graphlstm层结构图;
[0047]
图2是本发明的模型框架图;
[0048]
图3是本发明实施例的预测结果和真实结果对比图;
具体实施方式
[0049]
下面结合附图对本发明作进一步描述。
[0050]
参照图1-3,一种基于时序图网络的发酵过程软测量建模方法,所述方法包括以下步骤:
[0051]
(1)获取青霉素发酵过程数据集
[0052]
步骤1.1:设置inpensim仿真平台,每隔0.2小时进行1次变量测量,同时设置6组不同工况,最终获得6个工况下36个变量1100 个时刻6
×
36
×
1100的数据;
[0053]
步骤1.2:根据划分标准将数据分成3
×6×
1100、2
×
36
×
1100和 1
×
36
×
1100三个部分,分别为训练集、验证集和测试集。
[0054]
步骤1.3:根据标准化公式对每个数据进行处理。
[0055]
(2)进行青霉素发酵过程数据集数据选择,过程如下:
[0056]
步骤2.1:根据格兰杰因果检测公式计算出每个变量关于青霉素浓度变量的p值。
[0057]
步骤2.2:根据p值对变量进行筛选,保留前p《0.05的7个变量:冷热水流速rw、容积体积vv、容积重量vw、尾气co2浓度e
co2
、 co2上升速率r
co2
、尾气o2浓度e
o2
和o2上升速率r
o2

[0058]
步骤2.3:计算7个变量两两之间的p值,对p《0.05的两个变量之间视为存在因果关系,建立因果图。
[0059]
(3)进行图长短期记忆graphlstm模型训练,过程如下:
[0060]
步骤3.1:将训练集输入模型,获得模型第一次预测值。
[0061]
步骤3.2:根据预测值和输出值的差值,对模型的参数进行调整,使得预测值与真实值之间的差值减小。
[0062]
步骤3.3:将验证集输入模型,获得模型对于验证集的输出结果。
[0063]
步骤3.4:根据模型在验证集上的输出结果,对模型的超参数进行重新设定调招。
[0064]
步骤3.5:重复步骤3.1~3.4,直到模型的预测值和真实值之间的差值达到允许误差之内。
[0065]
(4)使用测试数据对模型进行测试,过程如下:
[0066]
步骤4.1:将训练数据输入训练后的模型和lstm中,分别得到图长短期记忆graphlstm和lstm在测试集上的预测值。
[0067]
步骤4.2:计算测试集的预测值和真实值之间的rmse,对图长短期记忆graphlstm和lstm性能进行评估。评估结果如表所示
[0068]
表1graphlstm和lstm的rmse对比
[0069][0070]
从上述对比结果可以看出,本发明对于青霉素发酵过程的关键产品质量预测效果优于传统预测模型。
[0071]
本方法基于图长短期记忆graphlstm提出时序图网络的发酵过程软测量建模方法。图长短期记忆graphlstm将发酵过程中的所有变量作为输入,对关键产品质量进行预测。此外,图长短期记忆graphlstm 在输入到状态和状态到状态的转换中都使用gcn结构,以此构建基于变量关系的长期依赖。最后,通过全连接层建立数据与目标变量之间的映射关系以获得关键产品质量的预测结果。
[0072]
本发明方法采用基于时序图网络的发酵过程软测量建模方法,提高了发酵过程关键产品质量的预测效果,具有普遍性和通用性。
[0073]
本说明书实施例所述的内容仅仅是对发明构思的实现形式的列举,本发明的保护范围不应当被视为仅限于实施例所陈述的具体形式,本发明的保护范围也及于本领域技术人员根据本发明构思所能够想到的等同技术手段。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1