基于协同训练偏最小二乘模型的工业过程软测量建模方法_2

文档序号:9196545阅读:来源:国知局
得到。接下来,建立Y1, yfi对于Mi和X1, X2…Xm对于t i的回归:
[0034]
[0035]
[0036]
[0037] 记芯。=Iaf5jFfldl/;?「,则残差矩阵为尽=五。-五。,F1 ,如果残差矩阵 匕中元素的绝对值近似为0,则认为用第一个成分建立的回归式精度已经满足要求了,可以 停止抽取成分,否则则用残差矩阵E1, F1代替E & Ftl重复进行上述步骤即可。
[0038] 假设最终共提取了 r个成分,则有
[0039]
[0040] 此时,得出¥的预测结果为¥ = 1:1|3广..+1^|31,将1:15='\¥1^ 1+...+¥151^11(1^=1,2... r)代入得到L个因变量的偏最小二乘回归方程式:
[0041] y』=b J1X1+…+bjmxm,(j = 1,2...L)
[0042] 记回归系数矩阵为'
。此时,记此模型在原有的训练集上的均 方误差为RMSEOTig。
[0043] 对于无标签数据集,对于每个样本点S1^attl = Xattl+ (i = 1,2…N),利用Mx,Sx对其进行标准化,即X = (X-Mx)My ,由Y = Xx矿^,+My ,得到一组新的数据 集
,将此N个样本点逐个添加到PLSl的训练集中去,每次可以 训练得到一个新的PLSl模型,每个新的PLSl模型在原有的训练集上都可以得到一个 新的RMSE,分别记为RMSEi, (i = 1,2…N)。分别计算这N个RMSE与RMSEtffig的差值: RMSEditi= RMSE ^ig-RMSEi, (i = 1,2…Ν),若所有RMSEdif均小于0,则认为已经达到终止 条件,停止迭代,否则,取使得RMSEdif最大的新加标签样本作为置信度最高的样本,亦即 心'乃=X jXBT,将样本&对应的第二视图信息及其预测值y』作为新 的有标签样本(xatt2;j,y」)添加到PLS2的训练集中去,更新PLS2的训练集,并从无标签数据 集中剔除样本点Xj。
[0044] 利用新的PLS2模型对剩下的无标签数据继续添加标签,并将所得的置信度最高 的新加标签样本添加到PLSl的训练集中去,再训练出新的PLSl模型选取置信度最高的样 本添加到PLS2的训练集中去,如此迭代循环;
[0045] 当达到循环停止条件后,亦即达到一定的循环次数或无法找到新的满足条件的无 标签样本,此时可以获取两组新的有标签数据集,利用这两组有标签数据训练得到最终的 PLSl和PLS2,将这两个模型的预测结果进行加权,得到最终的预测结果。
[0046] 第六步:将建模数据和各个模型参数存入历史数据库和实时数据库中备用。
[0047] 第七步:收集新的过程数据,并对其进行预处理和归一化。
[0048] 对于过程中新收集到的数据样本,除了对其进行预处理之外,还有采用建模时的 模型参数对该数据点进行归一化,即减去建模均值和除以建模标准差。
[0049] 第八步:采用基于协同训练算法的偏最小二乘方法对工业过程的变量进行预测, 并根据预测结果实行对于工业过程的监控与控制。
[0050] 以下结合一个具体的工业过程的例子来说明本发明的有效性。该过程的数据来自 美国TE (Tennessee Eastman--田纳西-伊斯曼)化工过程实验,原型是Eastman化学公 司的一个实际工艺流程。目前,TE过程己经作为典型的化工过程故障检测与诊断对象被广 泛研宄。整个TE过程包括41个测量变量和12个操作变量(控制变量),其中41个测量 变量包括22个连续测量变量和19个成分测量值,其中,22个连续测量变量每3分钟被采样 一次,而19个成分变量的米样间隔分6分钟与15分钟两种,所有的过程测量值都包含有高 斯噪声。为了实现对于成分变量的预测,我们选取了表1中的16个变量作为输入变量,选 取流9中的成分变量E作为模型输出值,接下来结合该具体过程对本发明的实施步骤进行 详细阐述:
[0051] 1.采集表1中的16个辅助变量变量数据以及其对应的主导变量成分E数据,对于 没有对应成分E信息的辅助变量数据也一并采集,进行数据预处理:
[0052] 对于包含主导变量信息的数据
)以及不包含主导变量信息的数据
,剔除过程的野值点和粗糙误差点,并对于变量进行拆分,取前八个变量为第 一视图,后八个变量为第二视图,得到新的数据集
)和
[0053] 2.针对训练数据,根据第一视图和第二视图的数据分别建立偏最小二乘软测量系 统模型,然后利用无标签数据来对模型进行更新。
[0054] 针对数据集
建立初始的PLSl模型,并对无标签数据集
进行预测,将所得置信度最高的样本的第二视图信息以及其所得预测值信息 添加到
中去,建立新的PLS2模型;继续利用PLS2模型获取新的置信度最 高的样本,并将其第一视图信息添加到
中去,继续循环迭代,直到达到终 止条件。
[0055] 3.利用得到的有标签训练集,训练出新的模型,并应用到TE生产过程中来对成分 E的信息进行预测,进行生产过程的监测与控制。
[0056] 利用协同训练的偏最小二乘算法,根据所检测到的辅助变量信息对TE过程的成 分E浓度信息进行实时预测,传统偏最小二乘算法与协同训练的偏最小二乘算法的预测结 果如图2所示,图3给出了它们预测值与真实值之间的绝对误差。针对预测的结果实现对 于生产过程进行调节与控制,维持工况稳定并及时防止故障的发生。
[0057] 表1 :输入变量说明
[0058]
[0059] 上述实施例用来解释说明本发明,而不是对本发明进行限制,在本发明的精神和 权利要求的保护范围内,对本发明做出的任何修改和改变,都落入本发明的保护范围。
【主权项】
1. 一种基于协同训练偏最小二乘模型的工业过程软测量建模方法,其特征在于,包括 以下步骤: (1) 利用集散控制系统以及离线检测方法,收集工业生产过程的数据组成建模用的训 练样本集。对于收集到的训练样本集,一部分为既包含主导变量数据也包含辅助变量信息 的样本集DeRKX\其中,所述D为有标签数据集,K为采样数据点个数,J为变量个数,R为 实数集;另一部分为只包含辅助变量数据的样本集XeRNX2M,其中,所述X为无标签数据集, N为采样数据点数,2M为变量个数,将这些数据存入历史数据库。 (2) 对于每个生产批次的有标签数据,沿着时间点方向对每一个数据矩阵进行排列,得 到新的数据矩阵,并对其进行预处理和归一化,即使得各个过程变量的均值为零,方差为1, 得到新的数据矩阵集为De 。 (3) 基于得到的二维数据矩阵按照主导变量和辅助变量分类标准,选取其 中的主导变量作为预测目标因变量集,选取其中的辅助变量作为自变量集(4) 对于有标签数据集,对其自变量集进行均分,前一半自变量作为第一自变量视 图'后一半自变量作为第二自变量视图:'得到两组 新的有标签数据集>并按照同样的变量拆 分方法对于无标签数据进行拆分,得到两组新的无标签数据集和(5) 首先,利用建立初始的模型PLS1,利用建立 初始的模型PLS2,然后,不断迭代使用无标签数据更新模型训练数据,当达到一定的终止条 件时,终止迭代。一般选取的终止条件为迭代达到一定次数抑或是无法继续找到置信度足 够高的样本。 (6) 将建模数据和各个模型参数存入历史数据库和实时数据库中备用。 (7) 收集新的过程数据,并对其进行预处理和归一化。 (8) 采用基于协同训练算法的偏最小二乘方法对工业过程的变量进行预测,实现过程 监控与控制。2. 根据权利要求1所述一种基于协同训练偏最小二乘模型的工业过程软测量建模,其 特征在于,所述步骤(3)具体为:利用传统的建模方法需要有模型输入与输出数据,对于采 样所得的数据矩阵集,因此需要将其变量分割为自变量与因变量,进而建立预 测模型。变量选取时,一般原则为以较为难以测量或比较重要的变量信息作为因变量,以其 余的变量作为自变量。3. 根据权利要求1所述一种基于协同训练偏最小二乘模型的工业过程软测量建模,其 特征在于,所述步骤(4)具体为:假设自变量X中包含的变量个数为2M,为了得到两个具有 一定差异性的软测量模型,拟将X中的2M个变量均分为两部分XattJPXatt2,并分别利用Xattl 及其对应的输出Y和Xatt2&其对应的输出Y建立初始的模型Modell和Model2,以进行接 下来的迭代。4. 根据权利要求1所述一种基于协同训练偏最小二乘模型的工业过程软测量建模,其 特征在于,所述步骤(5)具体为:对于(4)中所建立的初始模型Modell和Model2,首先,利 用Modell取置信度最高的预测数据添加到Model2的训练集中,并训练出新的Model2,再利 用Model2取置信度最高的预测数据添加到Modell的训练集中,再训练出新的Modell,如此 循环直到达到给定的终止条件。
【专利摘要】本发明公开了一种可用的训练样本个数较少的条件下工业生产过程的软测量研究方法,用于在建模数据较少条件下的软测量建模并实现对于产品信息的预测。本发明利用基于协同训练的偏最小二乘学习方法,建立了一个有效的线性预测模型,并克服了工业生产过程采样数据过少的情况下模型精度不高的问题,提高了针对该过程建立的模型预测准确率和性能,从而使得工业生产过程更加可靠,产品质量更加稳定。
【IPC分类】G05B13/04
【公开号】CN104914723
【申请号】CN201510266557
【发明人】包亮, 葛志强
【申请人】浙江大学
【公开日】2015年9月16日
【申请日】2015年5月22日
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1