一种基于数据模型的催化裂化装置优化方法与流程

文档序号:17770608发布日期:2019-05-28 19:22阅读:367来源:国知局
一种基于数据模型的催化裂化装置优化方法与流程

本发明涉及石油化工生产过程控制与优化领域,尤其涉及一种基于数据模型的催化裂化装置优化方法。



背景技术:

催化裂化是重质油轻质化的重要手段,是炼油厂生产汽柴油的核心装置,也是炼厂的主要效益来源。近年来,原油重质化、劣质化不断加剧,清洁燃料和低碳烯烃的市场需求在上升,安全环保的指标越来越严格,石化产品的国际竞争日趋激烈,这些新要求都对催化裂化生产提出了新的挑战。催化裂化是石油炼制行业中最复杂的催化生产装置,对整个装置建立过程机理模型十分复杂,大数据技术直接从海量的生产数据中挖掘规律,分析过程可以减少对复杂的过程机理的依赖。将大数据和人工智能等前沿的数据分析技术应用到装置优化领域,可进一步提高装置控制水平,提升装置在最优操作区间的平稳运行效率,提高目标产物收率,提升产品质量,降低能耗和生产成本,提高安全性,控制环保指标,从多个维度提高生产效率和增加经济效益。

目前,大数据技术在石油化工装置优化领域的应用尚处于发展的起步阶段,一些企业和科研单位开始进行了一些研究和尝试,取得了一些成果,但仍然存在很大的发展和改善空间。中石化九江石化催化裂化大数据应用示范研究项目代表了大数据技术在装置优化应用方面的最新成果,该研究利用传递熵算法研究了各个位点之间的相关性和因果链路,进而建立装置报警分析模型;通过主成分分析结合结焦机理分析确立关键参数,利用神经网络构建结焦预测模型,用聚类分析和互相关函数分析等建立关联网络,提供减缓结焦的方案;通过支持向量机等机器学习方法建立汽油收率预测模型。该项研究取得了初步应用效果,长期适用性有待检验。另一些研究,将八集总动力学模型与bp型神经网络结合预测催化裂化的产物收率,预测精度比单纯用集总模型有了提高,然而训练的生产样本数据只有120组,覆盖的时间范围较小,缺乏在更广泛的工况条件下的适用性检验。也有一些研究将人工神经网络技术应用于装置控制,但同样存在训练样本有限,应用范围较窄的问题。

因此,总结已有方法的不足,包括如下几方面:(1)机理模型复杂,建立难度大,用时长。(2)复杂机理模型非线性程度高,计算速度慢,收敛性差。(3)数据样本数量少,时间范围较小。(4)目前的方法未考虑时间延迟效应,数据之间的内在因果关系不对应,致使模型外推性能较差。(5)变量选择依赖人工专家经验,可能忽略一些影响变量,也可能增加无效变量,增加模型复杂度。



技术实现要素:

本发明为克服上述的不足之处,目的在于提供一种基于数据模型的催化裂化装置优化方法,本发明提出的根据生产历史大数据建立的反应装置模型,该方法不依赖复杂的过程机理;能够准确预测产物的收率和关键性质。本发明提出的变量关联性算法,能够从海量的dcs位号、lims变量里智能筛选出与目标变量强相关的变量,将模型复杂度降到最低,同时保证可靠性。同时,运算速度快,收敛性高,适应性强,可以用于指导实时在线优化。本发明采用智能算法确定不同工艺参数间的时间延迟效应,使计算更为准确。

本发明是通过以下技术方案达到上述目的:一种基于数据模型的催化裂化装置优化方法,包括如下步骤:

(1)读取装置的dcs、lims历史生产数据,建立dcs、lims标准数据库;规范数据库格式,建立索引规则,便于后期查询、新增、抽取;

(2)从标准数据库中抽取建模可能用到的变量数据进行预处理,为后面的分析做准备;其中预处理包括删除无效数据、对缺失值进行插值拟合填充、用数据平滑技术消除噪音信号和异常值的影响、变量分类、数据归一化处理;

(3)变量关联性分析,以挑选关联性强的变量进行建模;

(4)采用延迟时间分析技术校正各变量数据之间的时滞效应,得到因果关系直接对应的变量数据库;

(5)基于步骤(4)得到的变量数据库进料聚类和工况聚类;

(6)机器学习建立变量预测模型;

(7)针对实际生产的优化需求,设定优化目标及相应的约束条件,基于步骤(6)得到的变量预测模型进行优化,用全局优化算法计算出最佳的操作参数,得到优化模型;

(8)对应用模型进行预测和优化;

(9)设计两种模型自动更新模式,以适应新的工况。

作为优选,所述在步骤(2)中,插值方法可以选择最近邻插值、线性插值、三次样条插值中的一种;原始数据的平滑方法使用快速傅里叶滤波器平滑技术,以消除高频噪音信号以及异常值对数据分析的影响;变量类型划分:将变量划分为进料变量、控制变量(操作条件)、被控变量和中间监控变量;数据非负归一化处理,以消除不同变量的量纲差异,处理公式如下:

作为优选,所述步骤(3)具体为:对工艺流程内的所有变量进行关联性分析,得到相关系数矩阵,设定相关性阈值,从众多的变量中挑选关联性强的变量进行建模,保证精度的前提下减少复杂度;其中,变量关联分析采用如下方法:首先将dcs、lims变量的时间序列数据作图,转换为图像数据,再将图像数据进行适度压缩,保留主要图像变化特征,使用图像相似度算法计算趋势图的相似度,最终获取各变量的相似度系数矩阵。

作为优选,所述步骤(4)通过延迟时间分析技术来校正数据之间的时滞效应,其中,延迟时间判断方法为:首先根据装置尺寸信息和工艺参数,估算延迟时间的大概范围delay_min~delay_max,然后选择对应的dcs变量画出历史数据时间趋势图,根据图论的方法,建立图中波动信号的相似性模型,在±γ*delay_max时间范围内搜索波动信号的相似性,相似度最高的时间点确定为最佳延迟时间,γ为大于1的时间范围系数;最后,确立所有延迟时间后,得到延迟时间矩阵,用延迟时间矩阵对原始数据进行处理,得到因果关系对应的变量数据库。

作为优选,所述步骤(5)在聚类时,首先根据进料组成、性质、流量等特征将进料聚为m个类别,然后在每一类进料下面根据操作工况聚为n个类别,统计每个类别的样本量;聚类算法可以为模糊c均值聚类法、k均值聚类法、系统聚类法中的一种;其中,聚类距离的计算使用以下方法,公式如下:

其中,变量x1=(x11,x12,…,x1n);x2=(x21,x22,…,x2n);d12表示变量x1与x2之间的距离;α=(α1,α2,…αn)表示各性质分量的权重。α的确定方法如下:

α=xmax-xmin。

作为优选,所述步骤(6)具体为:根据步骤(3)的关联分析技术,确立预测模型的输入和输出变量,构建由多个神经网络组合而成的集成学习方法,用划分好的样本数据进行模型的训练和测试;参数学习采用小批量mini-batch梯度下降法,每个mini-batch里都要包含第5步聚类得到的每个类别的样本,样本从从每个类别中随机抽取,并且mini-batch中各个类别的样本数量要基本相同;经过训练得到神经网络输入输出预测模型。

作为优选,所述的优化模型可以根据需求构建汽油收率最大化模型,产品加权价值最大化模型,产品质量指标最优化模型。

作为优选,所述采用全局优化算法计算出最佳的操作参数具体为:首先根据步骤(5)的聚类规则确定待优化进料的类别,搜索这个类别下使得目标函数最优的历史样本,计算该样本进料与当前待优化进料的相似距离,设定一个距离阈值,如果距离小于阈值,就把历史样本的操作工况当做当前进料的最优工况;如果距离大于阈值,则将进料分为更小的类,然后重复上述搜索过程,直到得到最优工况;当要求进一步提高优化精度时,可用上述方法得到的工况做初值,然后用模拟退火法、遗传算法、粒子群算法中的一种全局优化算法进行优化求解。

作为优选,所述步骤(8)对应用模型进行预测和优化包括离线模式和在线模式,具体如下:

(i)离线模式:

基于变量预测模型,离线模式下手动输入进料信息和操作条件即可模拟预测产物的收率和产品性质;基于优化模型,离线模式下手动输入进料信息,即可计算出最佳的操作工况;

(ii)在线模式:

在线模式实时读取进料信息和操作条件相关的dcs、lims数据,根据预测模型实时预测当前操作工况下的产品收率和产品性质指标,充当软测量仪表,及时指导现场操作;优化功能实时读取描述进料信息的dcs、lims数据,应用步骤(7)得到的优化模型,实时计算出最佳操作工况建议;进一步地,优化模型可与先进控制结合,实现实时优化控制。

作为优选,所述设计的两种模型自动更新模式为:一是定时更新,二是当工况持续发生较大变化时,立即进行更新;更新时将新的生产数据加入到数据集中,同时淘汰一部分最旧的数据,用新的数据集训练出新的模型参数;装置传质性能等一些隐参数会随使用时间缓慢变化,定时更新可保证模型的时效性;工况发生较大调整时,需及时用新的生产数据训练出新的模型参数,适应新的工况。

本发明的有益效果在于:(1)本发明充分利用了生产历史数据,可以高效处理时间达数年以上,数据量达到几百万条的数据集;(2)本发明提出的相关性算法,将时间序列数据转换为图像数据,进行压缩后计算图像相似性,可利用gpu图形处理器进行高效并行计算,高效提取关联变量,使得大规模、高时效性的炼化企业实际应用成为可能;(3)本发明利用图论的方法计算了变量间的延迟时间,有效解决了装置建模中的时滞问题;(4)本发明采用组合多个神经网络的集成学习算法,可以实现多台计算机并行训练,既提高了模型精度高,又能保证较快的训练速度;(5)本发明设计的优化算法,保证绝对收敛,可以在较短时间内得到优化结果,及时响应装置的进料变化,并可根据精度需求调节优化时间;(6)本发明的通用性更好。样本数据密度大,采集间隔短,覆盖时间范围可以达到数年,通过聚类对样本分布进行处理避免样本倾斜,模型对各类工况的适应能力大幅提高;(7)本发明设计了模型参数的自动更新模式,保证适应最新的生产需求。

附图说明

图1是本发明的流程示意图;

图2是本发明构建的变量关联性分析方法流程示意图;

图3是使用本发明的延迟时间分析方法计算出的油气从分馏塔底气相入口到分馏塔顶的延迟时间示意图;

图4是本发明构建的对进料类别以及各类别下面的工况进行聚类示意图;

图5是本发明工况聚类分析的结果示例示意图;

图6是本发明预测模型对测试样例汽油收率预测的百分误差示意图。

具体实施方式

下面结合具体实施例对本发明进行进一步描述,但本发明的保护范围并不仅限于此:

实施例:如图1所示,一种基于数据模型的催化裂化装置优化方法包括如下步骤:

(1)建立生产历史数据库。读取催化裂化装置dcs系统和lims检测近一年的完整历史数据,生产工艺参数数据每1分钟自动记录一次,装置系统出口成分和产品物料性质检测数据每4小时分析一次。对dcs系统和lims系统的原始数据进行整理与合并,建立格式工整的数据库,以保证两类数据在后续分析中容易读取。

(2)数据抽取和预处理。对收集的dcs生产工艺参数数据和lims物料性质检测数据作描述性统计分析,分析数据的分布特点、类型、统计意义,判断数据集是否存在缺失值和异常值。使用插值拟合方法填补缺失值。使用快速傅里叶滤波器平滑技术对原始数据进行平滑,过滤高频噪音信号以及消除异常值的影响。然后对数据作非负归一化处理。将变量按照进料变量、控制变量、被控变量、中间变量进行标记划分。

(3)变量关联性分析以挑选关联性强的变量进行建模,如图2所示。dcs系统有516个位号,lims系统有340项物料性质检测,为得到尽可能精确而又尽可能简单的数学模型,需要选出一组与预测优化模型最相关的变量。先考虑所有位号和物料性质特征,根据生产装置实际,结合工艺工程师的专业知识和关联分析算法,对催化裂化装置的反应再生、分馏、吸收稳定三大系统进行模块化分析。先探索每个模块工艺参数间的相关性和因果关系网络,然后筛选出对成品收率和质量性质影响大的可调节工艺参数与性质特征作为数学模型的输入变量。关联分析采用图形相似度分析算法。

(4)用延迟时间分析技术校正各变量数据之间的时滞效应,如图3所示:

经过关联分析,筛选出了与产品收率和质量性质相关性较强的变量,首先根据装置尺寸信息和工艺参数,估算延迟时间的大概范围delay_min~delay_max,然后选择对应的dcs变量画出历史数据时间趋势图,建立波动信号的相似性计算模型,在±γ*delay_max时间范围内搜索波动信号的相似性(γ=2~100),相似度最高的时间点确定为最佳延迟时间。

确立所有延迟时间后,得到延迟时间矩阵,用延迟时间矩阵对原始数据进行处理,得到因果关系直接对应的变量数据库。

(5)进料聚类和工况聚类,如图4、图5所示:

基于上面第4步得到的数据库,对数据样本做聚类分析。首先根据进料组成、性质、流量等信息将进料聚为不同的类别,在每一类进料下面又将操作工况聚类为多个组别。按照数据波动的剧烈程度将进料类别聚为m类,m取2到30,每个进料类别下的操作工况聚为n类,n取2到50,统计每个类别的样本量。

(6)机器学习建立变量预测模型:

经过第3步分析,确立了优化模型的输入和输出变量,构建3到10个神经网络组合而成的集成学习方法,用划分好的样本数据进行训练和测试,参数学习采用小批量梯度下降法,每个mini-batch里包含第5步聚类的每个大类的样本,从每个大类中随机抽取一部分样本出来,mini-batch中各个大类样本的数量相同。经过训练得到输入输出预测模型。

(7)建立优化模型:

根据各产品的市场价格给各产品赋予价值系数,各产物的收率与价值系数的乘积之和作为总产品的价值函数,以总产品的价值函数最大化为目标,基于第6步得到的输入输出模型,用优化算法计算出不同进料条件对应的最佳操作参数。优化目标也可以选择汽油收率最大化,或者产品质量指标最优化。

最佳操作参数寻优采用本发明特别设计的算法,首先根据第5步的聚类规则确定待优化进料的类别,搜索这个类别下使得目标函数最优的历史样本,计算该样本进料与当前待优化进料的相似距离,设定一个距离阈值,如果距离小于阈值,就把历史样本的操作工况当作当前进料的最优工况;如果距离大于阈值,则将进料分为更小的类,然后重复上述搜索过程,直到得到最优工况。当要求进一步提高优化精度时,可用上述方法得到的工况做初值,然后用模拟退火法、遗传算法、粒子群算法等全局优化算法中的一种进行进一步寻优。

(8)对应用模型进行预测和优化;其中分离线模式与在线模式,如下所示:

离线模式:

基于第6步得到的预测模型,离线模式下手动输入进料信息和操作条件即可模拟预测产物的收率和产品性质。

基于第7步得到的优化模型,离线模式下手动输入进料信息,即可计算出最佳的操作工况。

在线模式:

在线模式实时读取进料信息和操作条件相关的dcs、lims数据,根据预测模型实时预测当前操作工况下的产品收率和产品性质指标,充当软测量仪表,及时指导现场操作。优化功能实时读取描述进料信息的dcs、lims数据,应用第7步得到的优化模型,实时计算出最佳操作工况建议。进一步地,优化模型可与先进控制结合,实现实时优化控制,保证装置长期处于最佳操作区间。

(9)模型自动更新:

设计两种模型自动更新模式,使预测优化模型总能适应新的工况。一是定时更新,二是当工况持续发生较大变化时,立即进行更新。更新时将新的生产数据加入到数据集中,同时淘汰一部分最旧的数据,用新的数据集训练出新的模型参数。装置传质性能等一些隐参数会随使用时间缓慢变化,定时更新可保证模型的时效性,定时更新周期选择1到6个月。工况发生较大调整时,需及时用新的生产数据训练出新的模型参数,适应新的工况。设计工况波动监控器,当波动程度持续超过设计阈值,自动启动更新模式。

将本发明方法用于一个炼化企业,如图6所示,应用本发明方法对一个月的工况进行预测优化,汽油/柴油收率平均预测误差小于2%,蒸馏点等关键性质的平均预测误差小于0.8%,预测模型达到了非常高的精度。优化模型根据价格数据和进料信息实时提供最佳操作参数的指导建议,每隔5-10min提供一次调节建议,用预测模型估算,启用优化模型提供的操作建议,可将总产品价值提高4%以上。

以上的所述乃是本发明的具体实施例及所运用的技术原理,若依本发明的构想所作的改变,其所产生的功能作用仍未超出说明书及附图所涵盖的精神时,仍应属本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1