快速无损实时预测原油性质模型的构建方法及其应用与流程

文档序号:13981488阅读:375来源:国知局
快速无损实时预测原油性质模型的构建方法及其应用与流程

本发明涉及快速无损实时预测原油性质模型的构建方法及其应用。



背景技术:

2016年,我国原油加工量攀升至5.41亿吨,原油进口量达到3.81亿吨,成为全球第一大能源进口国。作为炼化企业的最主要原料,一方面,原油的需求量剧增、进口量扩大、价格居高不下且波动频繁;另一方面,原油产品存在着性质劣质化、种类丰富、同名油前后性质有差异、装置进料要求高、混兑油性质难掌握等诸多特点。这些给炼化企业带来了巨大的压力。及时获得当前原油的性质评价数据——即原油快速评价,将为原油贸易、原油输送、原油调合、原油加工、全厂生产计划、生产调度等生产过程优化提供支撑。

原油评价包含指标众多,如密度、残炭、酸值、硫含量、氮含量、蜡含量、沥青质含量和实沸点蒸馏曲线等。采用传统的评价方法,存在分析时间长、处理繁琐、仪器要求高、劳动强度大等现象,已不能满足实际应用的需求。近红外分析技术是目前最有前景且应用最广泛的快速分析方法之一,在线近红外技术也是发展最迅速的过程分析技术之一。由于近红外分析仪是二次测量仪表,即近红外分析仪并不能直接测量物质属性,而必须先建立待测物质的属性与近红外光谱之间的数学模型然后根据模型来测量物质属性。因此,建立精度高、鲁棒性好的近红外模型是近红外技术能否有效应用的关键。

原油颜色深、黏稠度大而且常夹带杂质。若通过将原油样品置于近红外分析仪中的近红外谱图测量方式,会涉及到样品预处理、取样和后处理问题,致使测量过程繁琐。另外,若要实现工业在线检测,还需要配套复杂的原油样品预处理系统,致使投资大、长周期稳定运行难、在线分析实时性不足。

近红外检测分析技术的硬件部分本身技术成熟,特别是探头检测技术,其在实际应用中几乎不需要后期维护。在近红外光谱中,不同组分往往在同一波数处都有吸收,仅仅依靠谱峰的归属对被测物进行分析往往得不到有用的结果。原油黏稠、组分复杂,近红外光谱峰重叠严重,原油监控性质又多。因此,实际的炼油过程对原油快速评价技术提出了兼顾实用与精度的更高要求。即,一方面应避免原油预处理或原油预处理过程应简单、利于维护,另一方面要求优化建模方法和技术,提高性质预测模型精度高、减少模型维护难度低等,以满足工业实时在线分析要求。可以预想到,一种兼顾实用性、实时性、稳定性和良好预测精度的原油快速评价方法的发明,将倍受青睐。



技术实现要素:

鉴于上述问题,本发明提出了一种快速无损实时预测原油性质的方法。该方法通过选取合适型号的离线/在线近红外分析仪,并配置特定型号的透射式近红外光纤探头,采用将光纤探头直接插入原油样品的测量方式,快速无损获取近红外光谱图。利用一阶微分和多元散射校正的方法对原油近红外光谱图进行预处理,利用基于偏最小二乘法(pls)等回归建模方法建立的原油定量分析模型,可实现未知原油性质的快速预测分析。该方法与传统的原油快速测量方法相比,无需复杂的样品预处理,具有操作简单、快速无损、近红外光谱信噪比高、定量分析模型精度高等特点,可快速预测原油的性质,特别适用于工业在线实时预测原油的多个属性值如,密度、残炭、酸值、硫含量、氮含量、蜡含量、沥青质含量和实沸点蒸馏曲线等。

本发明提供的基于近红外透射式光纤探头检测原油近红外光谱数据并构建原油性质预测模型的方法包括以下步骤:

步骤一:构建原油校正集,测定校正集中原油的性质;

步骤二:采集原油近红外光谱;

步骤三:利用一阶微分和多元散射校正对步骤二获得的原油近红外光谱进行预处理;

步骤四:利用主成分分析方法对预处理后的光谱数据进行训练集样本的选择;

步骤五:根据原油待测项目和原油光谱数据集,选择特定的光谱波数;

步骤六:利用回归建模方法建立原油性质与近红外光谱数据之间的数学关联模型。

在一个或多个实施方案中,步骤一中,原油校正集包含了石蜡基原油、中间基原油和环烷基原油等不同属性原油。

在一个或多个实施方案中,用于构建校正集的原油20℃的密度在0.7-1.1g/cm3的范围内,硫含量在0.03%-5.50%的范围内,酸值在0.01-12.00mgkoh/g的范围内。

在一个或多个实施方案中,所述原油性质包括密度、残炭、酸值、硫含量、氮含量、蜡含量、沥青质含量和实沸点蒸馏曲线中的一个或多个。

在一个或多个实施方案中,步骤二包括,将校正集样品放置于30℃温度下(维持恒定),待原油样品温度达到稳定状态后,测定该原油样品的近红外光谱数据。

在一个或多个实施方案中,步骤二中,利用配置透射式近红外光纤探头的离线/在线近红外分析仪,将该透射式近红外光纤探头直接插入原油待测点的方式测得原油近红外光谱数据。

在一个或多个实施方案中,步骤二中,扫描范围为4000-12500cm-1,扫描次数为10-400次。

在一个或多个实施方案中,步骤三包括,利用一阶微分与多元散射校正对步骤二获得的波数范围为12500~4000cm-1区域的原油样本近红外光谱图进行预处理,消除基线和背景干扰,建立初始训练集。

在一个或多个实施方案中,步骤三所述的预处理包括:

a)计算每一样品的平均光谱即“理想光谱”;

b)对光谱x与进行线性回归,用最小二乘法求取b0和b;

其中,预处理后的光谱为xmsc=(x-b0)/b。

在一个或多个实施方案中,步骤四包括,对样本光谱进行主成分(pca)分析后,利用主成分得分作为特征变量,再利用样本间的欧式距离来选择样本,确定最终的训练集。

在一个或多个实施方案中,步骤四包括,采用剔除的方式对校正样本进行选择,包括:对样本光谱进行主成分(pca)分析后,利用主成分得分作为特征计算每个样本与邻近样本之间的欧式距离,并根据样本分布的密度确定阈值;其中,对于每一个样本,剔除与其距离小于阈值的样本,从而剔除冗余样本,剩余的样本作为校正样本;部分样本之间的欧式距离过小造成样本冗余,通过设定阈值并且剔除与其距离小于阈值的样本的方法来消除冗余样本。

在一个或多个实施方案中,步骤四所述的所有样本两两之间的欧式距离dij按下式计算:

式中,dij:第i个样本和第j个样本之间的欧式距离;

m:为主成分数;

xi:为第i个样本的主成分得分;

xj:为第j个样本的主成分得分。

在一个或多个实施方案中,步骤五中,所选择特定的光谱波数在4200-7550cm-1之间;优选地,对于密度,选择的光谱波数为4586-5025cm-1;对于残炭,选择的光谱波数为4247-6107cm-1;对于酸值,选择的光谱波数为4597-5461cm-1和6094-7513cm-1;对于硫含量,选择的光谱波数为4484-6493cm-1;对于氮含量,选择的光谱波数为4500-6600cm-1;对于蜡含量,选择的光谱波数为4500-6600cm-1;对于沥青质含量,选择的光谱波数为4500-6600cm-1;和对于实沸点蒸馏,选择的光谱波数为4599-7500cm-1

在一个或多个实施方案中,步骤六中,所述回归建模方法是偏最小二乘法。

在一个或多个实施方案中,步骤六中,所述原油性质包括密度、残炭、酸值、硫含量、氮含量、蜡含量、沥青质含量和实沸点蒸馏曲线中的一种或多种。

在一个或多个实施方案中,步骤六中,所述数学关联模型如下式所示:

y=a0+a1x1+a2x2+…+anxn

其中,y为预测的性质,ai为模型参数,xi为光谱第i个波数点的吸光度。

在一个或多个实施方案中,所述数学关联模型如下建立:

(1)分别提取两变量组的第一对成分,并使之相关性达最大;

假设从两组变量分别提出第一对成分为t1和u1,t1是自变量集x=(x1,…,xm)t的线性组合:u1是因变量集y=(y1,…,yp)t的线性组合:其中,要求:t1和u1各自尽可能多地提取所在变量组的变异信息;且t1和u1的相关程度达到最大;

由两组变量集的标准化观测数据阵e0和f0计算第一对成分的得分向量,记为

其中,e0为光谱矩阵记,f0为浓度矩阵记,如下所示:

使用第一对成分的得分向量的内积计算第一对成分t1和u1的协方差cov(t1,u1),故而将以上两个要求化为数学上的条件极值问题,如下式所示:

利用lagrange乘数法,问题化为求单位向量w1和v1,使最大;通过计算m×m矩阵的特征值和特征向量,且m的最大特征值为从而相应的单位特征向量就是所求的解w1,而v1由w1计算得到,即

(2)建立y1,…,yp对t1的回归及x1,…,xm对t1的回归;

假定回归模型为:

其中α1=(α11,…α1m)t,β1=(β11,…β1m)t分别是多对一的回归模型中的参数向量,e1和f1是残差阵,回归系数向量α1,β1的最小二乘估计为下式:

称α1,β1为模型效应负荷量;

(3)用残差阵e1和f1代替e0和f0重复以上步骤;

则残差阵如果残差阵f1中元素的绝对值近似为0,则认为用第一个成分建立的回归式精度已满足需要,可停止抽取成分,否则用残差阵e1和f1代替e0和f0重复以上步骤,即得:

w2=(w21,…w2m)t;v2=(v21,…v2p)t

为第二对成分的得分向量;

分别为y,x的第二对成分的负荷量,这时有

(4)设z×m数据阵e0的秩为r≤min(z-1,m),则存在r个成分t1,t2,…,tr,使得

代入y=t1β1+…+trβr,即得p个因变量的偏最小二乘回归方程式:

yj=aj1x1+…+ajmxm,(j=1,2,…,p)

其中,满足

在一个或多个实施方案中,所述方法还包括:构建原油验证集,并测定验证集原油的性质;用相同的透射式近红外光纤探头,在相同的测试条件下收集验证集原油样本的近红外光谱;根据步骤六建立的数学关联模型预测其相关性质,比较该原油样品对应性质的实测值和预测值,并视实际误差情况,可在步骤五中重新选择光谱波数,实现数学关联模型的优化。

本发明的有益效果如下:

本发明方法测试方式简单、快速,可直接将透射式近红外光纤探头插入待测点原油样品中,利用近红外光谱仪快速测定原油性质,光谱的测量时间只需不到一分钟,与传统的测量方法相比,大大缩短了检测时间。测试过程中无需使用任何试剂对原油样品处理,不损坏样品;同时不需要把样品从待测点取出送到近红外分析仪,待分析完成后样品再从仪器中排出,过程中不损失样品,同时可实现原油样品原位、实时分析。原油黏稠、组分复杂,采用本方法,在工业在线应用时,通过光纤的加长将近红外探头直接插到待测点上的原油中,避免繁琐的原油预处理系统,极易实现原油性质的实时在线检测。同时,本发明提出的综合建模方法,即,基于采用一阶微分和多元散射校正的方法对采集到的原油样本近红外光谱图进行预处理,通过主成分分析技术降维,并选择原油光谱图合适的波数范围,利用偏最小二乘法,建立原油属性值与其近红外光谱数据之间的数学模型,实现未知原油属性值的快速预测分析。利用该方法,预处理后的近红外光谱信噪比高,建立的模型精度高,可以同时检测原油的油品的密度、残炭、酸值、硫含量、氮含量、蜡含量、沥青质含量和实沸点蒸馏曲线。该发明解决了其他原油评价方法存在费时、费力、实用性和准确性不高等问题,提高了分析效率,是一种有效的方法,可为原油性质监控、储运、调合、常减压蒸馏装置操作等各项与原油有关业务的优化提供支撑。

附图说明

图1:基于透射式近红外光纤探头检测样品近红外光谱数据实验过程

图2:透射快速无损实时预测原油性质方法的总流程图。

图3:原始的原油近红外光谱图。

图4:预处理后的原油近红外谱图。

图5:pca分析主成分。

图6:剔除异常点的样本点图。

图7:近红外原油硫含量回归模型。

具体实施方式

图1显示本发明基于近红外透射式光纤探头检测近红外光谱数据过程。图2为本发明快速无损实时预测原油性质方法的总流程图,具体包括以下步骤:

(1)构建原油校正集,利用标准分析方法测定样品相关性质;

(2)利用近红外分析仪和透射式探头、采用探头直接插入原油中的方法测得近红外光谱数据;

(3)利用一阶微分和多元散射校正相结合的方法对光谱进行预处理;

(4)利用主成分分析技术对预处理后的光谱图进行特征变量筛选,并剔除异常样本;

(5)根据建模项目进行特征波数变量选择;和

(6)利用回归建模方法建立校正模型。

图2的流程图中还显示了利用所建的模型测试未知原油性质的步骤。

下文将对这些步骤进行详细描述。应理解,在本发明范围内中,本发明的上述各技术特征和在下文(如实施例)中具体描述的各技术特征之间都可以互相组合,从而构成优选的技术方案。

一、构建原油校正集,测定校正集中原油的性质

可收集不同种类的原油样本,通常覆盖石蜡基原油、中间基原油和环烷基原油等。通常,所收集的原油样本数量不少于50个。较好的是,所收集的原油样本的密度(20℃)、硫含量和酸值指标分别控制在0.7~1.1g/cm3、0.03%~5.50%和0.01~12.00mgkoh/g的范围之内。然后利用传统的标准方法测得所收集原油的多个性质属性,如密度、残炭、氮含量、硫含量、酸值、盐含量、蜡含量、沥青质和实沸点蒸馏收率等,并记录数据。

二、采集原油近红外光谱

可选取合适型号的离线或在线近红外光谱仪配以特定型号的透射式近红外光纤探头进行扫描,光纤探头光程可在0.5mm~20mm范围选择,采用将透射式近红外光纤探头直接插入原油样品(原油样品温度维持在30℃)的测量方式获得每份样本的近红外光谱。每张光谱扫描时间为10-400次,取平均值。光谱扫描范围为4000-12500cm-1,分辨率2-32cm-1。原油预处理光谱见图3。

三、利用一阶微分和多元散射校正对步骤二获得的原油近红外光谱进行预处理

该预处理包括对校正集每份样品的12500-4000cm-1的谱区进行一阶微分处理,消除基线和背景干扰,提高分辨率和灵敏度,之后对光谱进行多元散射校正。

该预处理的具体方法可包括:

a)计算每一样品的平均光谱即“理想光谱”);和

b)对光谱x与进行线性回归,用最小二乘法求取b0和b。

由此可获得预处理后的光谱,为xmsc=(x-b0)/b。

经步骤三的预处理后,可建立初始训练集。见图4。

四、利用主成分分析技术对预处理后的光谱图进行特征变量筛选,并剔除异常样本

本步骤是对步骤三中预处理过后的光谱进行校正样本的选择,从样本库中选择代表性强的样本建立模型,这样不仅可以提高模型的建立速度、减少模型库的储存空间,更为重要的是它便于模型的更新和维护。

在建立训练集之前,应首先剔除异常样本,这些异常样本可能含有异常化学组分或组分浓度较为极端,与其他样本存在显著差异。若这些样本点参与模型的建立,会影响分析模型的准确性和稳健性。

在本步骤中采用剔除的方式对训练样本进行选择,其基本过程为首先对样本光谱进行主成分(pca)分析后,利用主成分得分(图5)作为特征计算每个样本与邻近样本之间的欧式距离,并根据样本分布的密度确定阈值。对于每一个样本,剔除与其距离小于阈值的样本,从而剔除冗余样本,剩余的样本作为训练样本。部分样本之间的欧式距离过小造成样本冗余,通过设定阈值并且剔除与其距离小于阈值的样本的方法来消除冗余样本。剔除异常样本点后训练集见图6。

上述中所有样本两两之间的欧式距离dij按下式计算:

式中,dij:第i个样本和第j个样本之间的欧式距离;

m:为主成分数;

xi:为第i个样本的主成分得分;

xj:为第j个样本的主成分得分;

本步骤对训练集中的光谱样本进行波数选择。传统的观点认为多元校正方法具有较强的抗干扰能力,可全波数参与模型的建立,但是随着对偏最小二乘等方法的深入研究,发现通过筛选特征波数或区间有可能得到更好地定量模型。通过波数选择可以简化模型,并且通过波数选择可以剔除不相关的变量,得到预测能力更强,稳健性更好的模型。在本步骤中,优选地,对于密度选择波数范围为4586-5025cm-1、对于残炭选择波数范围4247-6107cm-1、对于酸值选择波数范围4597-5461cm-1和6094-7513cm-1、对于硫含量选择波数范围4484-6493cm-1、对于氮含量选择波数范围4500-6600cm-1、对于蜡含量选择波数范围4500-6600cm-1、对于沥青质含量选择波数范围4500-6600cm-1、和对于实沸点蒸馏选择波数范围为4599-7500cm-1

六、利用回归建模方法建立原油性质与近红外光谱数据之间的数学关联模型

此步骤利用经过预处理和波数选择的训练集中的原油样本的近红外光谱图与性质数值建立模型。可采用回归建模方法如偏最小二乘法来建立模型,该方法的主要思想如下:

偏最小二乘回归与主成分回归相比,不仅仅考虑了光谱矩阵,同时也考虑了浓度矩阵的影响,为了方便起见,光谱矩阵记为e0,浓度矩阵记为f0,如下所示:

具体步骤如下:

(1)分别提取两变量组的第一对成分,并使之相关性达最大

假设从两组变量分别提出第一对成分为t1和u1,t1是自变量集x=(x1,…,xm)t的线性组合:u1是因变量集y=(y1,…,yp)t的线性组合:为了回归分析的需要,要求:

1)t1和u1各自尽可能多地提取所在变量组的变异信息;

2)t1和u1的相关程度达到最大;

由两组变量集的标准化观测数据阵e0和f0,可以计算第一对成分的得分向量,记为

第一对成分t1和u1的协方差cov(t1,u1)可用第一对成分的得分向量的内积来计算;故而以上两个要求可化为数学上的条件极值问题:

利用lagrange乘数法,问题化为求单位向量w1和v1,使最大;问题的求解只须通过计算m×m矩阵的特征值和特征向量,且m的最大特征值为相应的单位特征向量就是所求的解w1,而v1可由w1计算得到

(2)建立y1,…,yp对t1的回归及x1,…,xm对t1的回归

假定回归模型为:

其中α1=(α11,…α1m)t,β1=(β11,…β1m)t分别是多对一的回归模型中的参数向量,e1和f1是残差阵;回归系数向量α1,β1的最小二乘估计为

称α1,β1为模型效应负荷量;

(3)用残差阵e1和f1代替e0和f0重复以上步骤

则残差阵如果残差阵f1中元素的绝对值近似为0,则认为用第一个成分建立的回归式精度已满足需要了,可以停止抽取成分,否则用残差阵e1和f1代替e0和f0重复以上步骤即得:

w2=(w21,…w2m)t;(v2=v21,…v2p)t

为第二对成分的得分向量;

分别为y,x的第二对成分的负荷量,这时有

(4)设z×m数据阵e0的秩为r≤min(z-1,m),则存在r个成分t1,t2,…,tr,使得

代入y=t1β1+…+trβr,即得p个因变量的偏最小二乘回归方程式:

yj=aj1x1+…+ajmxm,(j=1,2,…,p)

这里满足

本发明在预测待测原油样本的性质时,首先采用本发明步骤二中所述的方法测定待测原油样本的近红外光谱图,并且采用步骤三所述的方法对待测原油样本的近红外光谱图进行预处理,之后根据步骤五选择的波数范围选择变量,并利用步骤六中所建立的定量分析模型预测待测原油的相关性质。

下面通过实施例对本发明进行具体描述。有必要在此指出的是,以下实施例只用于对本发明作进一步说明,不能理解为对本发明保护范围的限制,该领域的专业技术人员根据本发明的内容作出的一些非本质的改进和调整,仍属于本发明的保护范围。

实施例1

以下以硫含量预测的实施例来说明本发明具体步骤包括:

步骤一:采集不同种类的原油样本109个,79个作为校正集,30个作为验证集。

步骤二:样品温度控制在30℃,选用bruker布鲁克近红外光谱仪,以及hellma透射式近红外光纤探头进行试验测定。通过将近红外光纤探头直接插入各原油样本的方式,测定原油样本的近红外光谱,光谱范围扫描范围为4000-12500cm-1,分辨率32cm-1,累计扫描次数32次。并且按照传统标准方法测量原油样本的硫含量。图3为原始的原油近红外光谱图。可以看到,原始光谱的基线漂移严重,谱峰重叠严重。

步骤三:选取8000-4000cm-1谱区范围的吸光度,对其进行一阶微分+多元散射校正预处理,建立原油样本近红外光谱矩阵。图4为预处理之后的谱图。

步骤四:对预处理后的原油样本采用剔除的方式进行训练样本的选择,首先对预处理后的原油样本光谱进行主成分分析后,利用主成分得分(图5)作为特征计算每个样本与邻近样本之间的欧式距离,并对于每一个样本,比较其与邻近样本之间的欧氏距离与阈值1.8,剔除与其距离小于阈值的样本,本例中剔除样本2、3、15、17、28、54,从而剔除冗余样本,剩余的样本作为训练样本。最终,选中70个训练样本构成原油光谱训练样本集(图6)。

步骤五:根据待测项目为硫含量,优选的波数区间为4484-6493cm-1

步骤六:运用偏最小二乘法建立硫含量值与近红外光谱的回归模型,预测属性与近红外光谱之间的关系如下式

y=a0+a1x1+a2x2+…+anxn

其中:y为预测属性,ai为模型参数,xi为光谱第i个波数点的吸光度。

所建的硫含量回归模型建图7。利用验证集对模型进行验证:对待测原油样本首先根据步骤二测得近红外光谱,根据步骤三中的方法,对8000-4000cm-1谱区内对其进行一阶微分+多元散射校正预处理,之后选择4484-6493cm-1的波数区间,最后利用步骤六中建立的模型对其进行预测。决定系数达0.8741,交互验证均方误差为0.00402。预测值与实际值的比较结果如下表1所示,预测过程快速、简单,预测结果准确。

表1:预测值与实际值结果

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1