基于带滑动窗口贝叶斯网络的自适应软测量预测方法与流程

文档序号:11323917阅读:362来源:国知局
基于带滑动窗口贝叶斯网络的自适应软测量预测方法与流程
本发明属于工业过程控制领域,尤其涉及一种基于带滑动窗口贝叶斯网络的自适应软测量预测方法。
背景技术
:软测量的目标是建立适当的模型,使用易于测量的过程变量预测难以测量或者测量存在大时延的质量变量。实时准确的预测出质量变量有利于控制产品质量,提高生产效率。软测量模型一般分为机理模型和数据驱动的模型。随着计算机技术的发展,数据驱动的建模方法受到了越来越多的关注。常见的数据驱动建模方法有很多,目前使用最广泛的是主成分分析和偏最小二乘方法,这两种都是线性模型;考虑到过程的不确定性,将概率形式加入到这两种方法中,就得到了概率的主成分分析和基于概率的偏最小二乘方法;将支持向量回归的方法用于软测量领域取得了较高的预测效果;还有神经网络的方法也可用于预测。但在实际工业过程中,由于过程的漂移、催化剂的失效等会引起模型的退化,简单地说就是原来建立的模型不再适用于现有的运行状态,因此需要不断地更新模型使它适用于时变的工业过程。技术实现要素:针对现有技术中的不足,本发明提出一种基于带滑动窗口贝叶斯网络的自适应软测量预测方法,它根据新来样本不断更新现有模型以此适应时变的工业过程。本发明的优势在于,能对不断变化的工业过程作出准确的质量预报,并给出相应的预测精度,即使在数据集存在缺失的情况下,也能获得良好的预测效果,具体技术方案如下:一种基于带滑动窗口贝叶斯网络的自适应软测量预测方法,其特征在于,包括以下步骤:步骤一:收集工业过程中的历史数据集:将易于测量的过程变量作为输入,即x=[x1;x2;…;xn]∈rn×m,其中x的每一列代表一个过程变量,每一行代表一个样本;将不容易实时测量的质量变量作为输出,即y=[y1;y2;…yn]∈rn×1;步骤二:从历史数据集中选择时间上最接近待预测样本的w个样本,w表示滑动窗口的大小,即x=[x1;x2;…;xw]∈rw×m,以及与它们相对应的y=[y1;y2;…yw]∈rw×1,根据已有的专家知识,确定网络结构,利用数据学习得到各节点参数,构建贝叶斯网络模型。具体方法如下:(a)计算w个样本中各过程变量的均值和质量变量的均值并将原始数据减去相应的均值做数据标准化处理;(b)根据专家知识,将所有易于测量的过程变量均作为父节点,需要预测得到的质量变量作为上述各父节点的子节点;各父节点与子节点间用一条有向边连接,箭头指向子节点,各父节点之间没有边相连,从而形成贝叶斯网络的结构;(c)当各节点服从高斯分布时,将所有父节点设置为可观测节点,唯一的子节点设置为隐含节点;将选出的w个样本放入(b)中已建立的贝叶斯网络中,如果此时w个样本中父节点数据缺失,将缺失值置为空后,直接进行后面的参数学习;所述的参数学习过程采用em算法,通过不断迭代给出各个节点参数的最大似然估计;当数据中存在缺失现象时,参数学习的过程如下:随机给定缺失数据的初值,根据给定初值估计模型参数;根据估计的模型参数重新计算缺失值,如此反复迭代直至待估计参数收敛;(d)根据步骤(c)参数学习的结果,获得步骤(b)中各节点的先验概率分布,包括各节点的均值和方差,此时得到一个完整的贝叶斯网络;步骤三:将新来的输入样本xq按照步骤二的(a)作标准化处理后,作为证据添加进步骤二中已构建的贝叶斯网络中,通过联合树推理引擎得到待预测节点的后验概率分布,包括均值和方差;将待预测节点的后验概率分布中的均值作为预测值,并计算实际测量真值y与预测值的误差;步骤四:当有标签的新样本数逐渐累积达到滑动窗口前进的步长s后,将这最新的s个样本添加进滑动窗口,同时删除滑动窗口中最老的s个样本,保持滑动窗口中样本个数w不变;用新的w个样本更新步骤二中原始的w个样本,重新进行数据标准化处理,并进行步骤二中(c)及以后的步骤,继续预测下一时刻的质量变量。进一步地,所述的预测误差采用均方根误差rmse来衡量预测结果的准确性,其计算公式如下:公式中n表示测试样本的个数,yreal代表测量的真实值,ypred代表由贝叶斯网络得到的预测值。本发明的有益效果是:本发明通过滑动窗口更新模型,在窗口内运用贝叶斯网络建模,每新来一个样本预测,将已有新样本的输入作为证据添加进原有网络,使用联合树推理引擎完成查询过程,得到预测值和相应的方差。即使在训练数据和测试数据均有不同程度缺失率的情况下,也能较好地预测质量变量,且预测精度较高。附图说明图1为本发明方法预测co2剩余含量的结果示意图;图2为带滑动窗口的偏最小二乘方法预测co2剩余含量的结果示意图;图3为本发明方法在训练数据和测试数据均有约20%缺失的情况下的结果示意图。具体实施方式本发明针对工业过程中的软测量问题,该方法首先从数据集中选出在时间上离待预测样本最接近的数据作训练样本,运用贝叶斯网络的方法建立模型,并将待预测样本的输入作为证据添加进网络中,经推理得出预测值。当新样本积累到一定数量时,删除旧样本,添加新样本,更新训练样本集,重新建立贝叶斯网络用于后续新样本的预测,具体技术方案如下:一种基于带滑动窗口贝叶斯网络的自适应软测量预测方法,包括以下步骤:步骤一:收集工业过程中的历史数据集:将易于测量的过程变量作为输入,即x=[x1;x2;…;xn]∈rn×m,其中x的每一列代表一个过程变量,每一行代表一个样本;将不容易实时测量的质量变量作为输出,即y=[y1;y2;…yn]∈rn×1;软测量的目的是建立适当的模型,实现每来一个新样本xq能准确及时地预测出其对应的yq。步骤二:从历史数据集中选择时间上最接近待预测样本的w个样本,w表示滑动窗口的大小,即x=[x1;x2;…;xw]∈rw×m,以及与它们相对应的y=[y1;y2;…yw]∈rw×1,根据已有的专家知识,确定网络结构,利用数据学习得到各节点参数,构建贝叶斯网络模型,具体方法如下:(a)计算w个样本中各过程变量的均值和质量变量的均值并将原始数据减去相应的均值做数据标准化处理;(b)根据专家知识,将所有易于测量的过程变量均作为父节点,需要预测得到的质量变量作为上述各父节点的子节点;各父节点与子节点间用一条有向边连接,箭头指向子节点,各父节点之间没有边相连,从而形成贝叶斯网络的结构;(c)当各节点服从高斯分布时,将所有父节点设置为可观测节点,唯一的子节点设置为隐含节点;将选出的w个样本放入(b)中已建立的贝叶斯网络中,如果此时w个样本中父节点数据缺失,将缺失值置为空后,直接进行后面的参数学习;所述的参数学习过程采用em算法,通过不断迭代给出各个节点参数的最大似然估计;当数据中存在缺失现象时,参数学习的过程如下:随机给定缺失数据的初值,根据给定初值估计模型参数;根据估计的模型参数重新计算缺失值,如此反复迭代直至待估计参数收敛;(d)根据步骤(c)参数学习的结果,获得步骤(b)中各节点的先验概率分布,包括各节点的均值和方差,此时得到一个完整的贝叶斯网络;步骤三:将新来的输入样本xq按照步骤二的(a)作标准化处理后,作为证据添加进步骤二中已构建的贝叶斯网络中,通过联合树推理引擎得到待预测节点的后验概率分布,包括均值和方差;将待预测节点的后验概率分布中的均值作为预测值,并计算实际测量真值y与预测值的误差;所述的预测误差采用均方根误差rmse来衡量预测结果的准确性,其计算公式如下:公式中n表示测试样本的个数,yreal代表测量的真实值,ypred代表由贝叶斯网络得到的预测值。显然,均方根误差rmse越小,表示贝叶斯网络预测的精度越高。用该指标可以定量比较各种模型的预测能力。步骤四:当有标签的新样本数逐渐累积达到滑动窗口前进的步长s后,将这最新的s个样本添加进滑动窗口,同时删除滑动窗口中最老的s个样本,保持滑动窗口中样本个数w不变;用新的w个样本更新步骤二中原始的w个样本,重新进行数据标准化处理,并进行步骤二中(c)及以后的步骤,继续预测下一时刻的质量变量。以下结合一个具体的工业过程的例子来说明本发明的有效性。co2吸收塔是实际化工合成氨过程中的一个子单元。整个工艺过程可大致描述为:来自前一单元的工艺气经过初步降温后,在工艺冷凝分离罐再次降温,进入吸收塔。经过吸收塔后的工艺气,送入到除雾分离罐中,残余co2由仪表记录。罐中吸收co2后,吸收液由贫液,半贫液变成富液。富液从罐底部经富液闪蒸槽送入再生塔中,进行溶液的再生操作,再生的溶液被抽回吸收塔。co2吸收塔中发生的主要化学反应是co2+k2co3+h2o←→2khco3+q。为了最大限度地利用co2,最后工艺气中残余的co2含量应尽可能的少。吸收塔中共有12个变量如下表1所示。前11个变量较易测量得到,第12个变量工艺气中残余co2含量较难测量,因此对这12个变量建立贝叶斯网络,用前11个变量预测co2剩余含量。接下来结合该具体过程对本发明的实施步骤进行详细地阐述:1.采集co2吸收塔正常运行过程中的数据,选择离待预测样本时间上最接近的w个样本,数据标准化处理后,建立贝叶斯网络。在该贝叶斯网络中,共有12个节点,前11个为可观测的父节点,第12个节点为隐含的子节点,共有12条有向边,均为从父节点出发指向同一个子节点。当这12个节点均服从高斯分布时,用已挑选好的w个样本进行参数学习,获得这12个节点的先验概率分布。2.新来一个输入样本xq,将xq作为证据添加进上步已建好的贝叶斯网络中,由联合树推理引擎求得唯一子节点的后验概率分布,即子节点的均值和方差。将求得的均值作为预测值,方差反映了预测值的波动大小,可作为预测值精度的衡量指标。3.当新来样本累积到一定数量后,删除窗口中前s个样本(s为滑动窗口前进的步长),同时将新增的s个样本放到窗中的最后,对这w个样本做标准化处理后,重新进行参数学习得到新的贝叶斯网络,此后用更新后的贝叶斯网络作预测。表1co2吸收塔工艺中的变量变量编号变量描述1工艺气压力12液位13出口贫液温度4贫液流量5半贫液流量6出口工艺气温度7工艺气进出口压差8出口富液温度9液位210高液位报警值11工艺气压力212工艺气中残余co2含量采用本发明方法预测co2含量的结果如图1所示,带滑动窗口的偏最小二乘方法预测co2剩余含量的结果如图2所示,两种方法的预测精度对比如表2所示,从表2可以看出,本发明的基于带滑动窗口贝叶斯网络的自适应软测量预测方法比带滑动窗口的偏最小二乘方法的预测精度高。本发明方法在训练数据和测试数据均有约20%缺失的情况下的预测结果如图3所示,表3给出了本发明方法在不同数据缺失率下的预测误差表,从表3可以看出,即使数据存在一定的缺失,本发明仍然有较高的预测精度。表2本发明方法和带滑动窗口的偏最小二乘方法的预测精度对比表建模方法预测的均方根误差预测最大误差的绝对值带滑动窗口的贝叶斯网络方法0.00062040.003672带滑动窗口的偏最小二乘方法0.00085550.007038表3本发明方法在不同数据缺失率下的预测误差表数据缺失率预测均方根误差预测最大误差的绝对值0%0.00062040.0036724.92%0.00064100.00379810.27%0.00065150.00380719.76%0.00078350.004244上述实施例用来解释说明本发明,而不是对本发明进行限制,在本发明的精神和权利要求的保护范围内,对本发明做出的任何修改和改变,都落入本发明的保护范围。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1