一种基于增量支持向量回归的自适应质量预报方法与流程

文档序号:18462351发布日期:2019-08-17 02:08阅读:499来源:国知局
一种基于增量支持向量回归的自适应质量预报方法与流程
本发明属于工业过程控制及软测量领域,涉及一种基于增量支持向量回归的自适应质量预报方法。
背景技术
:工业过程中存在着许多无法或难以直接测量的变量,这些变量通常与产品质量密切相关,是必须进行监控的参数,软测量技术是解决该问题的一种有效方法,目前已在工业过程中得到广泛应用。近年来,基于数据驱动的软测量建模方法得到了人们的普遍关注。其中,支持向量回归基于结构风险最小化原则,较好地解决了小样本、非线性和局部极小等问题,已被广泛应用于多个研究领域。目前的支持向量回归学习算法大多是离线、批处理式的,而在大多数工业过程中,由于过程环境的改变、平台仪器设备的老化、原材料进料变化以及催化剂活性退化等各种因素,过程物理化学特性处在不断的变化之中,因而其运行工况经常发生变化,一般具有动态时变的特点。这样离线训练得到的模型不能保证长期适用,因此对支持向量回归在线学习方法的研究具有重要的理论意义和使用价值。为了正确跟踪过程状态,需要对软测量模型进行及时自适应更新和校正。针对工业过程的时变特性,因此有专家提出了滑动窗支持向量回归、局部加权支持向量回归等。若不加区分地对每一个新增样本都进行增量学习,类似于滑动窗口这种模式势必造成模型频繁更新,本发明基于支持向量回归模型的kkt条件,实现对新增样本的区分学习,一定程度上降低了模型更新频率,提高了模型更新效率。技术实现要素:针对目前工业过程时变特性,本发明提出了一种基于增量支持向量回归的自适应质量预报方法,该方法基于支持向量回归的kkt条件选择出那些包含足够多新信息的样本进行增量学习,能够在保证模型泛化能力的同时降低模型更新频率,从而实现了工业过程的自适应质量预报。本发明具体技术方案如下:(1)收集历史工业过程中的训练数据集p(x,y)∈rn×m,其中包括输入数据x和质量变量y,n表示样本个数,m表示变量个数,r表示实数集;(2)将步骤(1)中收集到的训练数据集p标准化:化为均值为0,方差为1的新数据集并对标准化的新数据集建立支持向量回归模型并得到一部分支持向量svs,该模型可通过下式求解;其中,w为法向量,b为位移项,为非线性映射函数,xi为输入数据,wt为法向量的转置,yi为质量变量值,c是惩罚因子,ξ和ξ*是松弛因子,ε为容忍误差,i为样本索引。引入lagrange函数,并将公式(1)改成凸二次规划问题:其中为对偶参数,k(xi,xj)=φ(xi)tφ(xi)称为核函数,φ(xi)为非线性映射函数,这里选用高斯核函数:k(xi,x)=exp(-gamma·||xi-x||2)(8)其中,gamma表示核函数参数;由此可构造决策函数定义样本系数偏差和边界函数h(xi)=f(xi)-yi。则根据系数偏差值和边界函数值,基于优化上述问题的kkt条件,将训练数据集p分为以下三个子集:其中,e为误差支持向量集,s为边界支持向量集,r为剩余样本集。(3)将采集到的实时数据标准化处理,并利用步骤(2)得到的支持向量回归模型对新样本进行质量预测并输出结果(4)当获得质量变量y的真实输出ynew时,计算h(xnew)为预测误差,xnew为新输入数据;(5)通过h(xnew)进一步判断新增数据集是否满足kkt条件即检验|h(xnew)|是否大于ε,如果大于ε则表明不满足kkt条件,表示当前模型并不能很好地描述新增数据集,需要对新增数据集进行增量学习,将新增数据集加入到svs中更新模型;若小于ε则表明满足kkt条件则继续用旧模型预测;(6)当有新训练数据集获得时,重复步骤(3)至步骤(5),实现工业过程的自适应质量预报。与现有技术相比,本发明具有的有益效果是:针对过程时变特性,本发明提出一种基于增量支持向量回归的自适应建模方法。通过对训练样本有选择地添加或删除,实现模型在线更新,以有效地跟踪过程工况的变化。相比于传统的滑动窗方法,每次都需要重新建模,一定程度上提高了模型的更新效率。附图说明图1是在线自适应建模流程图;图2是脱丁烷塔流程图;图3是滑动窗支持向量回归的预测输出结果图;图4是增量支持向量回归的预测输出结果图;具体实施方式下面结合具体实施方式对本发明基于增量支持向量回归的自适应工业质量预报方法作进一步的详述。一种基于增量支持向量回归的自适应质量预报方法,其中,所述的增量支持向量回归的自适应质量预报方法的流程如图1所示,在线获得新的训练数据集后,检测新数据集是否满足现有模型的kkt条件,若不满足,则进行增量学习训练数据集信息。具体步骤如下:(1)收集历史工业过程中的训练数据集p(x,y)∈rn×m,其中包括输入数据x和质量变量y,n表示样本个数,m表示变量个数,r表示实数集;(2)将步骤(1)中收集到的训练数据集p标准化:化为均值为0,方差为1的新数据集并对标准化的新数据集建立支持向量回归模型并得到一部分支持向量svs,该模型可通过下式求解;其中,w为法向量,b为位移项,为非线性映射函数,xi为输入数据,wt为法向量的转置,yi为质量变量值,c是惩罚因子,ξ和ξ*是松弛因子,ε为容忍误差,i为样本索引。引入lagrange函数,并将公式(1)改成凸二次规划问题:其中为对偶参数,k(xi,xj)=φ(xi)tφ(xi)称为核函数,φ(xi)为非线性映射函数,这里选用高斯核函数:k(xi,x)=exp(-gamma·||xi-x||2)(13)其中,gamma表示核函数参数;由此可构造决策函数定义样本系数偏差和边界函数h(xi)=f(xi)-yi。则根据系数偏差值和边界函数值,基于优化上述问题的kkt条件,将训练数据集p分为以下三个子集:其中,e为误差支持向量集,s为边界支持向量集,r为剩余样本集。(3)将采集到的实时数据标准化处理,并利用步骤(2)得到的支持向量回归模型对新样本进行质量预测并输出结果(4)当获得质量变量y的真实输出ynew时,计算h(xnew)为预测误差,xnew为新输入数据;(5)通过h(xnew)进一步判断新增数据集是否满足kkt条件即检验|h(xnew)|是否大于ε,如果大于ε则表明不满足kkt条件,表示当前模型并不能很好地描述新增数据集,需要对新增数据集进行增量学习,将新增数据集加入到svs中更新模型;若小于ε则表明满足kkt条件则继续用旧模型预测。这样做的目的是为了让模型拥有自适应更新的能力,当遇到新的状态信息或者过程发生明显变化的时候,模型能够根据新来的信息及时更新模型的参数;总的来说,本发明针对过程时变特性,提出一种基于增量支持向量回归的自适应建模方法。通过对训练样本有选择地添加或删除,实现模型在线更新,以有效地跟踪过程工况的变化。相比于传统的滑动窗方法,每次都需要重新建模,一定程度上提高了模型的更新效率。(6)当有新训练数据集获得时,重复步骤(3)至步骤(5),实现工业过程的自适应质量预报。此外,均方根误差(rmse)对预测性能进行定量评价,表达式如下所示:其中,yi是质量变量值,是模型的预测输出,nts表示在线测试样本的个数。实施例以下结合一个具体的脱丁烷塔例子来说明增量支持向量回归模型的性能。脱丁烷塔是一个用于软测量建模算法验证的一个常用的标准工业过程平台。脱丁烷塔是精炼过程中的装置之一,流程图如图2所示,该装置的目的是为了去除石脑油气体中丙烷和丁烷的过程脱丁烷塔,塔底的丁烷含量是一个十分重要的关键指标,为了提高脱丁烷塔的控制质量需要对于塔底丁烷含量建立软测量模型。表1给出了针对关键质量变量丁烷含量所选择的7个辅助变量,并对其进行了一定的变量描述,分别为塔顶温度、塔顶压力、回流流量、下一级流量、灵敏板的温度、塔底温度和塔底压力。表1:输入变量说明针对该过程,连续等时间间隔采集了2394个样本。最初的1000个样本组成了原始的训练数据集,剩下的1394个样本作为测试数据集。首先对初始训练数据集建立初始支持向量回归模型,并对1394个数据进行在线学习,其中有1148个数据参与了增量学习。为了跟踪状态的变化特性,验证本发明的自适应软测量方法,对比了滑动窗支持向量回归方法,分别如图3、4所示。其中,滑动窗口大小设置为1000,窗口步长设置为1;对于本发明方法,步长大小也为1。通过图3和图4可以看出两者的效果虽然在整体上相差不多,都可以较好的跟踪预测趋势,但是本发明的增量支持向量回归在一些变化幅值较大的样本点附近跟踪效果要更好,而滑动窗支持向量回归表现的性能较差。表2给出了两种方法的预测效果和计算时间的比较,从表中可以看出,本发明的方法在rmse上有着较好的表现,相比于滑动窗支持向量回归rmse降低了0.0357。但是从更新时间上来看,相比于滑动窗方法,本发明的更新时间为前者的六分之一左右。总的来说,本发明的方法不管在预测误差还是在更新时间上,都有着一定的优势。表2两种方法的预测效果和计算时间方法滑动窗支持向量回归增量支持向量回归rmse0.13830.1026更新时间(s)37.56.5当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1