基于有偏估计的近红外定量分析模型构建方法与流程

文档序号:19281434发布日期:2019-11-29 22:59阅读:436来源:国知局
基于有偏估计的近红外定量分析模型构建方法与流程

本发明属于油品检测技术领域,涉及油品调合质量反馈控制过程中油品属性的在线检测方法。



背景技术:

汽油调合是成品汽油出厂前的最后一道工序,是实现经济效益的重要环节。在油品质量反馈控制系统中,需要对油品属性进行及时、准确的在线检测;这是保证产品合格、减少质量过剩的重要手段。目前,汽油的关键属性,如研究法辛烷值、马达法辛烷值等主要通过人工采样并利用astm标准的马达机才可获取;此类方法成本过高、检测周期长不宜用于在线质量反馈控制中。在线近红外技术可根据油品的近红外光谱实现对关键属性的实时检测,因此基于该技术的油品质量反馈控制是当前研究的热点问题之一。当前,在油品调合领域,近红外定量分析模型训练样本的选择往往先根据生产调度信息获知产品标号,初选出与目标工况密切相关的建模样本,然后反复试差,最终确定建模样本。当分析模型用于质量反馈控制系统中时,为了避免因模型预测值偏高而引发的产品质量不合格,需要模型专家实时校正预测模型。由于现有方法没有从数据内在角度分析建模样本的选择,且未能从建模本质考虑预测偏差对生产的影响,较难获取适合用于质量反馈控制的预测结果。



技术实现要素:

本发明的目的在于提供基于有偏估计的近红外定量分析模型构建方法,本发明的有益效果是能从够建模本质考虑预测偏差对生产的影响,从而获取适合用于质量反馈控制的预测结果。

本发明所采用的技术方案是按照以下步骤进行:

s1:数据预处理:首先从历史数据集o中初选训练样本

oinit={x∈rn×m,y∈rn×l}∈o

(n代表样本数,m代表样本维度);

训练样本进行初选的方法:从数据集oinit中选取ylow≤y≤yup组成测试集小样,式中,

其中,stdy为oinit中属性值的标准差,k为灵敏度参数,yobj为目标定单的油品属性出厂指标。遍历o数据集,选择出满足ylow≤y≤yup的所有样本组成oinit。

s2:训练样本优化选择:根据目标工况,从oinit样本集中选择合适的建模样本组成子集oopt∈oinit,优选后的样本作为近红外定量分析模型的建模样本;s21:构造适应度函数

其中,n为oinit数据集中的总样本数,nl为从oinit中选择的建模样本数,w为权重因子,为交叉验证的预测值,为采用κ=1,2,...,nl个样本构建模型给出的预测值。

s22:采用二进制编码方法,对oinit数据集中的样本进行编码,若所述数据集中某个样本被选为建模样本,则其编码值为1,否则为0。

s23:利用遗传算法迭代选择部分样本构成训练集,并计算所述训练集对应的适应度函数值。s24:选择最小适应度函数值对应的解组成最优训练集oopt。

步骤s21中的权重因子w为:

其中,γ为位置参数。

步骤s22中采用二进制对样本编码。

步骤s23中采用遗传算法进行优化求解。

s3:利用所述建模样本建立属性y与近红外光谱x之间的有偏最小最大概率回归模型:通过误差下确界的选取使模型的预测偏差以最大概率在期望的方向上;

采用有偏最小最大概率机建立回归模型,对近红外光谱数据x和属性数据y做如下处理:

ui=(yi+ε,xi,1,xi,2,....,xi,j,...,xi,m),u=(u1,u2,...un)t

vi=(yi-ε,xi,1,xi,2,...,xi,j,...,xi,m),v=(v1,v2,....,vn)t

其中,ε为给定的绝对误差上确界。

步骤s3中需要指定绝对误

差上确界。步骤s3有偏最

小最大概率机模型为:

maxα

α,a≠0,b

其中,α为u类的正确分类概率下确界,η0为给定的v类正确分类概率下确界。

s4:完成对所述模型的参数调优:将测试集近红外光谱带入模型进行预测,根据输出的预测值与参考值计算出模型对应的均方根误差对比,选择最佳模型参数。

包括:

s41:从工业现场采集样本构建测试集;

s42:给定v类正确分类概率下确界η0的搜索范围以及步长;

s43:遍历η0,并根据所述有偏最小最大概率回归模型在测试集上输出的预测值和参考属性计算均方根误差rmse:

其中,为预测值,yi为参考属性,n为样本数。

s44:选定使rmse最低的η0为模型参数。

本发明方法首先采用有偏最小最大概率回归算法构建适应度函数,完成对训练样本的选取,在降低建模样本数量的同时能够最大程度的提高所选样本对目标工况的代表性;再利用有偏最小最大概率回归构建近红外定量分析模型,以此提供概率有偏预测输出。

该方法的优势在于可利用遗传算法对训练样本进行选择,极大地提高了建立近红外定量分析模型的质量和效率;通过有偏最小最大概率回归建立预测模型,可以较好的处理非高斯数据,给出的概率有偏预测值可极大提高油品调合质量反馈控制的控制效果。

附图说明

图1是优选的训练样本。

具体实施方式

下面结合具体实施方式对本发明进行详细说明。

以实际汽油汽油调合过程为例,该过程主要包含组分油及调合成品油属性检测、调合配方实时优化、管道阀门比例控制3大部分,如图1所示,组分油管道阀门的开度由调合配方决定,优化服务器依据调合成品油以及组分油的实时属性进行在线优化。

调合成品汽油数据采自国内某炼油厂汽油管道调合过程过程中的监测数据,汽油近红外光谱的波长范围为1100nm-1300nm,波长精度为1nm;样本研究法辛烷值的参考值采用astm标准的马达机测定。历史数据集中共包含350组样本,测试集中包含250组样本。

通过matlab对上述算法进行仿真,对本发明做进一步详述:

第一步:根据生产工况要求及从历史数据求出历史数据的stdy=0.49,工况要求调合成品汽油ron≥93.8,依据经验最终取k=1;那么,从历史数据集中选取93.31≤y≤94.29的样本组成初始训练集oinit;

第二步:利用s21中的方法构造适应度函数,并利用s22-s24中所述方法采用ga算法进行训练样本优选。最终选择出120个训练样本。

第三步:利用所选出的训练样本构建有偏最小最大概率回归模型,并确定

最优η0=0.29;

第四步:利用上述训练样本以及模型参数,建立有偏最小最大概率回归模型,用于在线过程。

选用梯度下降法求解所述最小最大概率模型,求解后获得回归方程为:

其中,

以上所述仅是对本发明的较佳实施方式而已,并非对本发明作任何形式上的限制,凡是依据本发明的技术实质对以上实施方式所做的任何简单修改,等同变化与修饰,均属于本发明技术方案的范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1