基于多变量相关性及时滞性的流程工业系统预测模型的制作方法

文档序号:15928520发布日期:2018-11-14 01:23阅读:282来源:国知局

本发明涉及流程工业生产领域,特别涉及一种基于多变量相关性及时滞性的流程工业系统预测模型。

背景技术

流程工业普遍包含诸多重要的生产过程指标或变量,现场操作人员仅根据经验对某些特别关注的关键指标进行监测,从而调控整个生产过程,最终达到稳定生产的目标,如高炉炼铁过程中铁水温度,硅含量以及多种质量指标等。工业生产过程通常具有非线性和大滞后等特征,对这些指标的测量往往耗时长,难以检测,或根本无法检测,因此针对其建立有效的数学模型进行实时预测就显得尤为重要。另外,从实时生产调度出发,操作人员希望预先了解某些关键指标的未来变化趋势,这也使得指标趋势预测成为目前流程工业生产过程监控的重要任务。

被预测的指标值往往与生产过程中的多个过程变量相关,进行生产过程指标预测首先需要将与被预测指标最相关的特征变量从众多候选变量中挑选出来。通常数据变量(特征)的选择包括通过经验知识手动选择和基于数据分析的选择方法。通过经验知识的方法虽然方便快捷,但时常会因为经验不足出现错选漏选或特征冗余的情况。流程工业生产过程通常具有时滞性,输入变量的变化往往需要经过一段时间才能反映到被预测的指标上,所以需将输入变量的时滞性考虑到预测建模中。但是目前通常基于人工经验来手动选取延迟时间,预测模型建模的效果往往是难以保证的。传统的生产过程指标预测采用基于机理的建模方法,该方法在工艺机理分析的基础上,依据物料平衡、热量平衡和动力学建立数学模型。由于工业生产常常具有非平衡、非稳定和强非线性等特点,此类机理模型成本高、难度大,其准确性和可靠性难以保证,往往存在模型精度低和容易失配等问题。基于数据的预测建模与机理建模不同的是此类方法只关注模型的输入和输出,而无需对生产过程的反应或动力学等机理信息进行研究。



技术实现要素:

本发明的一个目的是克服现有技术通过经验知识和基于数据分析的方法预测某些关键指标未来变化趋势,容易出现错选漏选或特征冗余的问题,提供了一种基于多变量相关性及时滞性的流程工业系统预测模型。

本发明解决其技术问题所采用的技术方案是:基于多变量相关性及时滞性的流程工业系统预测模型,确定待预测指标和相关指标,所述相关指标是指对待预测指标产生影响的指标变量;获取待预测指标变量某一时段的时间序列,作为比较序列;获取所述相关指标变量在同一时段的时间序列,作为参考序列;计算所述参考序列和比较序列的相关联度;设置关联度阈值,根据相关联度对相关指标进行筛选,得到相关指标的特征变量集合s;将所述特征变量集合s作为人工神经网络的输入变量,将待预测指标变量作为判断的基准变量,以最小化预测误差为目标,去除特征变量集合s中的无关和冗余特征变量,并在此过程中调整人工神经网络的参数,最终得到最优输入特征子集a,同时也建立了有效的待预测指标预测模型。

进一步地,所述根据相关联度对相关指标进行筛选,得到相关指标的特征变量集合s,具体是指,将比较序列与参考序列的最大关联度,和所述关联度阈值比较,将大于所述关联度阈值的最大关联度对应的特征变量组成特征变量集合s。

进一步地,所述计算所述参考序列和比较序列的相关联度,包括:

设参考序列为x0=[x0(1),...,x0(n)],比较序列为x1=[x1(1),...,x1(i)];

对所述参考序列和比较序列进行无量纲化处理:

根据公式

其中,在区间[k,k+1]上的面积变化量;在区间[k,k+1]上的面积变化量;

计算的相关联度为:

进一步地,所述最大关联度是指:

s1:从参考序列x0截取某一段序列并表示为第一参考序列x00=[x0(1),...,x0(n-i)],从同一时段的比较序列x1中截取相应序列并表示为第一比较序列x11=[x1(1+i),...,x1(n)],其中0≤i<n;

当i=1时,x00=[x0(1),...,x0(n-1)],x11=[x1(2),...,x1(n)];

对第一参考序列x00和第一比较序列进行x11无量纲处理得到

s2:计算的当前关联度:此时,参考序列x0和比较序列x1的最大关联度κmax=κcurr,时滞步数lags=i;

s3:令i=i+1更新第一参考序列x00和第一比较序列进行x11,重复步骤s2,得到二者的当前关联度:κ′curr;

若κ′curr>κmax,则令最大关联度κmax=κ′curr;否则,不处理;

s4:c为设定的循环次数,判断i≤c,是否成立,若成立,则重复步骤s3;

若不成立,则返回候选变量序列x0和参考序列x1最大关联度κmax和相应的时滞步数lags,x1相对于x0的延迟时间t=τ·lags,τ为采样周期。

进一步地,所述去除特征集合s中的无关和冗余特征变量,得到最优输入特征子集a,同时建立有效的待预测指标预测模型,具体包括:

2.1初始化输入特征子集a′,即a′={s(i)},i=1,初始化人工神经网络隐含层神经元个数和学习率;

2.2将输入特征子集a′结合当前时刻t和延迟时间t的值以及历史时刻d的待预测指标的值作为人工神经网络的一个输入样本,送入人工神经网络,计算人工神经网络的实际输出;

t时刻待预测指标的预测值表示为:

计算预测值与真实值的差值y(t)为t时刻待预测指标的真实值;

根据差值d调整人工神经网络的参数;

对每个时刻重复上述过程,直到差值d不超过设定的范围;

其中:n为第i个变量的样本数量,y(j)为待预测指标的真实值,为待预测指标的预测值;

计算待预测指标预测误差ε(i):

2.3更新输入特征子集a′={a′+s(i+1)},得到待预测指标预测误差ε(i+1);

比较ε(i)与ε(i+1)的大小,若ε(i)>ε(i+1),则认为第i+1个变量为有效变量,保留第i+1个变量,跳至步骤2.2;

否则,令a′={a′-s(i+1)},跳至步骤2.2;

当i=n-1时,循环结束,从而得到与待预测指标最相关的且去除无关和冗余特征变量的最优输入特征子集a,a=a′,此时的人工神经网络就是有效的待预测指标预测模型。

本发明的实质性效果:本发明方法通过选择合适的相关特征变量,选定特征变量的延迟时间,并将延迟时间融合预测模型,以递进选择策略去除冗余变量,优化模型参数,建立了有效的待预测指标预测模型,最终实现对流程工业关键指标的有效预测。

具体实施方式

下面通过具体实施例,对本发明的技术方案作进一步的具体说明。

基于多变量相关性及时滞性的流程工业系统预测模型,

(1)确定待预测指标和相关指标,所述相关指标是指对待预测指标产生影响的指标变量;

(2)获取待预测指标变量某一时段的时间序列,作为比较序列;获取所述相关指标变量在同一时段的时间序列,作为参考序列;

(3)计算所述参考序列和比较序列的相关联度;

将比较序列与参考序列的最大关联度,和所述关联度阈值比较,将大于所述关联度阈值的最大关联度对应的特征变量组成特征变量集合s。

计算所述参考序列和比较序列的相关联度,包括:

设参考序列为x0=[x0(1),...,x0(n)],比较序列为x1=[x1(1),...,x1(i)];

对所述参考序列和比较序列进行无量纲化处理:

根据公式

其中,在区间[k,k+1]上的面积变化量;在区间[k,k+1]上的面积变化量;

计算的相关联度为:

(4)设置关联度阈值,根据相关联度对相关指标进行筛选,得到相关指标的特征变量集合s,具体是指:

将比较序列与参考序列的最大关联度,和所述关联度阈值比较,将大于所述关联度阈值的最大关联度对应的特征变量组成特征变量集合s;

最大关联度是指:

s1:从参考序列x0截取某一段序列并表示为第一参考序列x00=[x0(1),...,x0(n-i)],从同一时段的比较序列x1中截取相应序列并表示为第一比较序列x11=[x1(1+i),...,x1(n)],其中0≤i<n;

当i=1时,x00=[x0(1),...,x0(n-1)],x11=[x1(2),...,x1(n)];

对第一参考序列x00和第一比较序列进行x11无量纲处理得到

s2:计算的当前关联度:此时,参考序列x0和比较序列x1的最大关联度κmax=κcurr,时滞步数lags=i;

s3:令i=i+1更新第一参考序列x00和第一比较序列进行x11,重复步骤s2,得到二者的当前关联度:κ′curr;

若κ′curr>κmax,则令最大关联度κmax=κ′curr;否则,不处理;

s4:c为设定的循环次数,判断i≤c,是否成立,若成立,则重复步骤s3;

若不成立,则返回候选变量序列x0和参考序列x1最大关联度κmax和相应的时滞步数lags,x1相对于x0的延迟时间t=τ·lags,τ为采样周期。

(5)将所述特征变量集合s作为人工神经网络的输入变量,将待预测指标变量作为判断的基准变量,以最小化预测误差为目标,去除特征变量集合s中的无关和冗余特征变量,并在此过程中调整人工神经网络的参数,最终得到最优输入特征子集a,同时也建立了有效的待预测指标预测模型,具体包括:

2.1初始化输入特征子集a′,即a′={s(i)},i=1,初始化人工神经网络隐含层神经元个数和学习率;

2.2将输入特征子集a′结合当前时刻t和延迟时间t的值以及历史时刻d的待预测指标的值作为人工神经网络的一个输入样本,送入人工神经网络,计算人工神经网络的实际输出;

t时刻待预测指标的预测值表示为:

计算预测值与真实值的差值为t时刻待预测指标的真实值;

根据差值d调整人工神经网络的参数;

差值d对应的损失函数和人工神经网络的权重有关,通过损失函数对权重求偏导数,偏导数乘以人工神经网络的学习率,用权重减去这个乘值,就能得到修正后的新的权重=,原先的人工神经网络也得到了更新;

权重其中,α为学习率,e(who)为误差的损失函数;

以最小化预测值与实际值的差值为原则,当误差对权重的偏导数大于零时,权值调整量为负,实际输出大于期望输出,权值向减少方向调整,使得实际输出与期望输出的差减少。当误差对权值的偏导数小于零时,权值调整量为正,实际输出少于期望输出,权值向增大方向调整,使得实际输出与期望输出的差减少;

对每个时刻重复上述过程,直到差值d不超过设定的范围;

其中:n为第i个变量的样本数量,y(j)为待预测指标的真实值,为待预测指标的预测值;

计算待预测指标预测误差ε(i):

2.3更新输入特征子集a′={a′+s(i+1)},得到待预测指标预测误差ε(i+1);

比较ε(i)与ε(i+1)的大小,若ε(i)>ε(i+1),则认为第i+1个变量为有效变量,保留第i+1个变量,跳至步骤2.2;

否则,令a′={a′-s(i+1)},跳至步骤2.2;

当i=n-1时,循环结束,从而得到与待预测指标最相关的且去除无关和冗余特征变量的最优输入特征子集a,a=a′,此时的人工神经网络就是有效的待预测指标预测模型。

以上所述实施例只是本发明的一种较佳的方案,并非对本发明作任何形式上的限制,在不超出权利要求所记载的技术方案的前提下还有其他的变体及改型。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1