用于液化天然气储罐运行数据挖掘的数据处理方法及系统

文档序号:30924529发布日期:2022-07-29 23:31阅读:200来源:国知局
用于液化天然气储罐运行数据挖掘的数据处理方法及系统

1.本发明属于数据处理技术领域,尤其涉及一种用于液化天然气储罐运行数据挖掘的数据处理方法及系统。


背景技术:

2.对液化天然气(liquefied natural gas,lng)储罐物理运行过程开展数字孪生时,需要精确描述工艺流程中各参数的变化过程。lng储罐工艺流程复杂,运行参数多,蒸发气(boil-off gas,bog)的挥发量受环境温度、罐内液位、管壁保温效果和储罐收发液等因素影响,传统的机理模型存在偏差,有必要对实际的运行数据开展数据挖掘,寻求运行数据的内在关联。
3.发明人发现,直接利用传统机器学习方法挖掘lng储罐实际运行数据,存在产生过拟合的问题,不利于运行工况的外延模拟,限制了数字孪生的精度与应用范围。


技术实现要素:

4.本发明为了解决上述问题,提出了一种用于液化天然气储罐运行数据挖掘的数据处理方法及系统,属于一种针对lng储罐运行物理过程数字孪生的运行数据预处理方法;本发明以最大限度降低了过拟合情况的出现,可以保证数字孪生中对于运行数据挖掘的可靠度。
5.为了实现上述目的,本发明是通过如下的技术方案来实现:第一方面,本发明提供了一种用于液化天然气储罐运行数据挖掘的数据处理方法,包括:根据储罐内温度和储罐外温度的差值,得到第一特征值;根据进料液化天然气温度和储罐内液化天然气温度的差值,得到第二特征值;基于设备运行参数,构建第三特征值;根据罐内液化天然气温度对时间的导数,得到第四特征值;根据罐内气相物理状态参数与体积相关参数的代数运算结果对时间的导数,得到第五特征值;根据压缩机出口气相物理状态参数和排量的代数运算,得到第六特征值;根据机器学习算法,以所述第一特征值、所述第二特征值、所述第三特征值、所述第四特征值、所述第五特征值和所述第六特征值中的一个或多个特征值为标签,其他特征值为输入进行数据拟合。
6.进一步的,所述第一特征值等于储罐外壁温度和储罐内液化天然气温度的差值。
7.进一步的,所述第二特征值等于进料液化天然气温度和储罐内液化天然气温度的差再乘上进料口流量。
8.进一步的,所述第三特征值等于罐底泵排量。
9.进一步的,所述第四特征值等于罐内液化天然气温度对时间的导数再乘上液化天然气的液位高度。
10.进一步的,所述第五特征值等于储罐高度与液化天然气液位高度的差值乘上气相
压力后与蒸发气温度的比值再对时间求导。
11.进一步的,所述第六特征值等于压缩机出口压力和压缩机出口流量的乘积与压缩机出口温度的比值。
12.第二方面,本发明还提供了一种用于液化天然气储罐运行数据挖掘的数据处理系统,包括:特征值构建模块,被配置为:根据储罐内温度和储罐外温度的差值,得到第一特征值;根据进料液化天然气温度和储罐内液化天然气温度的差值,得到第二特征值;基于设备运行参数,构建第三特征值;根据罐内液化天然气温度对时间的导数,得到第四特征值;根据罐内气相物理状态参数与体积相关参数的代数运算结果对时间的导数,得到第五特征值;根据压缩机出口气相物理状态参数和排量的代数运算,得到第六特征值;数据拟合模块,被配置为:根据机器学习算法,以所述第一特征值、所述第二特征值、所述第三特征值、所述第四特征值、所述第五特征值和所述第六特征值中的一个或多个特征值为标签,其他特征值为输入进行数据拟合。
13.与现有技术相比,本发明的有益效果为:本发明基于lng储罐换热、相变物理模型,对lng储罐原始运行数据进行重组或计算,在考虑储罐内外温度差值、进料液化天然气和储罐内液化天然气温差、设备运行参数、罐内气相物理状态参数与体积相关参数的关系以及压缩机出口气相物理状态参数和排量的关系等参数或关系的基础上,重新构建了多个特征值,并对多个特征值进行了拟合,结果表明,与原始特征值拟合相比,以本发明中构建的多个特征值为基础进行拟合,极大的降低了过拟合情况的出现,可以保证数字孪生中对于运行数据挖掘的可靠度。
附图说明
14.构成本实施例的一部分的说明书附图用来提供对本实施例的进一步理解,本实施例的示意性实施例及其说明用于解释本实施例,并不构成对本实施例的不当限定。
15.图1为本发明实施例1的原始特征拟合效果;图2为本发明实施例1的重组特征值后拟合效果图;图3为本发明实施例1的基于储罐系统热平衡物理模型的数据预处理示意图。
16.具体实施方式:下面结合附图与实施例对本发明作进一步说明。
17.应该指出,以下详细说明都是示例性的,旨在对本技术提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本技术所属技术领域的普通技术人员通常理解的相同含义。
18.实施例1:本实施例提供了一种用于液化天然气储罐运行数据挖掘的数据处理方法,包括:根据储罐内温度和储罐外温度的差值,得到第一特征值;根据进料液化天然气温度和储罐内液化天然气温度的差值,得到第二特征值;基于设备运行参数,构建第三特征值;根据罐内液化天然气温度对时间的导数,得到第四特征值;根据罐内气相物理状态参数与体积相关参数的代数运算结果对时间的导数,得到第五特征值;根据压缩机出口气相物理状态参数和排量的代数运算,得到第六特征值;
根据机器学习算法,以所述第一特征值、所述第二特征值、所述第三特征值、所述第四特征值、所述第五特征值和所述第六特征值中的一个或多个特征值为标签,其他特征值为输入进行数据拟合。
19.通过本实施例中方法得到的新的特征值,可以有效解决lng储罐运行原始数据机器学习时陷入的过拟合问题,使lng储罐运行数据的机器学习结果的外延性更优,为基于机器学习方法的储罐运行数据挖掘提供新特征值;具体为,基于lng储罐换热和相变物理模型,对lng储罐原始运行数据进行重组或计算,获取新特征值,包括储罐热量输入部分、lng蓄热部分和相变热部分;其中,储罐热量输入部分:对于温度差引发的热量输入,基于原始温度数据差值,构建新特征值;对于设备热源引发的热量输入,基于设备运行主要参数,构建新特征值;罐内lng蓄热部分:取罐内lng温度对时间的导数,并以此构建新特征值;相变热部分:针对罐内bog总量,取罐内气相物理状态参数与体积相关参数的代数运算结果对时间的导数,并以此构建新特征值;针对排出罐外的bog量,取压缩机出口气相物理状态参数、排量等原始数据的代数运算结果,并以此构建新特征值。
20.构建第一特征值,针对lng储罐内外温度相关原始数据,提取第一特征值x1,其为tw与t
l
的重组结果,重组形式为t
w-t
l
。其中,tw代表储罐外壁温度,t
l
代表储罐内lng温度。
21.构建第二特征值,针对lng储罐进料引发冷/热量输入相关原始数据,提取第二特征值x2,其为qi、ti与t
l
的重组结果,重组形式为qi(t
i-t
l
)。其中,qi代表进料口流量;ti代表进料lng温度;t
l
代表储罐内lng温度。
22.构建第三特征值,针对设备热源引发的热量输入,基于设备运行主要参数,构建新特征值;具体方法为lng储罐存在罐底泵产热,针对此设备热源相关原始数据,提取第三特征值x3:q
p
。其中,q
p
代表罐底泵排量。
23.构建第四特征值,针对罐内lng蓄热部分,取lng温度对时间的导数,并以此构建新特征值;具体的方法为提取第四特征值x4,其为l与t
l
的重组结果,重组形式为。其中,t
l
代表储罐lng温度;l代表lng液位高度;t代表时间。
24.构建第五特征值,针对相变热部分中罐内bog总量,取罐内气相物理状态参数与体积相关参数的代数运算结果对时间的导数,并以此构建新特征值;具体的方法为提取第五特征值x5,其为p、h
tank
、l与tg的重组结果,重组形式为。其中,p代表气相压力;tg代表bog温度;h
tank
代表储罐高度,m;l代表lng液位高度。
25.构建第六特征值,针对相变热部分中排出罐外的bog量,取压缩机出口气相物理状态参数、排量等原始数据的代数运算结果,并以此构建新特征值;具体的方法为提取第六特征值x6,其为p
dis
、q
dis
与t
dis
的重组结果,重组形式为。其中,p
dis
代表压缩机出口压力;q
dis
代表压缩机出口流量;t
dis
代表压缩机出口温度。
26.如图3所示,为基于储罐系统热平衡物理模型的数据预处理示意图;从热量角度出发,以lng储罐内部空间为研究对象,存在单位时间内热量输入与转化之间的平衡。lng储罐内热量输入主要包括lng储罐周围环境导入储罐内部的热量、lng储罐进料引发的冷量/热量输入以及lng储罐罐底泵运行产热;基于能量守恒定律,输入lng储罐的热量除了升高lng
温度外,剩余热量则使lng发生相变,转化为bog,其一部分积累在储罐气相空间中,引起气相空间压力、温度、高度变化,另一部分,则被压缩机抽出罐外。
27.热量输入部分数据预处理,热量输入部分数据预处理是将热量输入部分采集的所有数据划分为三个子数据集依次进行预处理,包括导热部分数据预处理、lng储罐进料引发冷/热量输入部分数据预处理、罐底泵运行产热部分数据预处理,并且分别提取第一特征值x1、第二特征值x2和第三特征值x3。
28.导热量部分数据预处理,基于导热计算方程,通过lng储罐外部监测点温度与储罐内部lng温度差衡量导热量,提取第一特征值x1:t
w-t
l

29.其中,qc表示罐体导热引发的热量输入,w;λe表示储罐保温层当量导热系数,w/(mk);a
tank
表示储罐外表面积,m2;tw表示储罐保温层近外表处温度监测点的温度,k;t
l
表示储罐lng温度,k由罐底温度与罐顶温度取平均得到;表示保温层内近外表温度监测点与罐内壁距离,m。
30.可以看出,λe、a
tank
和均为常数,故上式可表示为如下形式:其中,为λe、a
tank
和的乘积。
31.基于以上预处理操作,梳理出第一特征值x1的表达方式,即储罐外壁温度与储罐lng温度的差值t
w-t
l
,保证第一特征值x1能够与现场数据测量点对应。其中,tw由储罐外壁温度监测点获取;t
l
为储罐内lng温度由储罐底部温度监测点与储罐顶部温度监测点取平均获取。tw和t
l
两者的差值在一定程度上反应了导入储罐内部热量的多少,若两者差值越大,则导入储罐内部的热量越多;反之,则越少。
32.lng储罐进料引发冷/热量输入部分数据预处理,基于下面计算方程,通过进料口流量与进料lng温度和原储罐内部lng温度差的乘积衡量lng储罐进料引发冷/热量,提取第二特征值x2:qi(t
i-t
l
)。
33.其中,qi表示进料引发的热量输入,w;qi表示进料口流量,m3/s;表示lng密度,kg/m3;ti表示进料lng温度,k;t
l
表示原储罐中的lng温度,k;c表示lng比热容,j/( kgk)。
34.可以看出,比热容c、lng密度近似为恒定值,忽略c与的变化。故上式可表示为如下形式:其中,为c和的乘积。
35.基于以上预处理操作,梳理出第二特征值x2的表达方式,即进料口流量与进料lng温度和储罐内lng温度差值的乘积qi(t
i-t
l
),保证特征值x2能够与现场数据测量点对应。其
中,ti为lng储罐进料温度由现场lng储罐进料温度监测点获取;qi为进料口流量由现场进料流量监测点获取;t
l
为储罐内lng温度由储罐底部温度监测点与储罐顶部温度监测点取平均获取。
36.第二特征值x2:qi(t
i-t
l
),即lng储罐进料温度监测点与储罐底部温度监测点和储罐顶部温度监测点的平均值的差值,再乘以进料流量监测点。
37.罐底泵运行产热量部分数据预处理,基于下面计算方程,通过罐底泵排量衡量罐底泵运行产热量,提取第三特征值x3:q
p

38.其中,表示罐底泵扬程,m;q
p
表示罐底泵排量,m3/s,表示罐底泵效率,与流量有关。
39.可以看出,g为常数,lng密度近似为恒定值,忽略的变化,而罐底泵效率、罐底泵扬程与罐底泵排量有关。故上式可表示为如下形式:其中,为g、、和的乘积。
40.基于以上预处理操作,梳理出第三特征值x3的表达方式,即罐底泵排量q
p
,保证第三特征值x3能够与现场数据测量点对应。其中,q
p
为低压泵流量由现场两个低压泵排量监测点的加和确定。
41.lng蓄热部分数据预处理,基于下面计算方程,忽略lng密度与比热容c的变化,通过储罐内部lng液位高度与lng温度变化率的乘积衡量lng温度上升对应的热量,提取第四特征值x4:。
42.其中,q
tem
表示lng温度变化吸收或者散发的热量,w;r表示储罐内半径,m;l表示lng液位高度,m;t表示时间,s。
43.可以看出,r为常数,比热容c、lng密度近似为恒定值,忽略c与的变化,故上式可表示为如下形式:其中,为、π、r2和c的乘积。
44.基于以上预处理操作,梳理出第四特征值x4的表达方式,即,保证第四特征
值x4能够与现场数据测量点对应。其中,l为lng液位高度由储罐内lng液位传感器监测得到,t
l
为储罐内lng温度由储罐底部温度监测点与储罐顶部温度监测点取平均获取。
45.根据储罐内lng温度的变化及时间,可拟合出其关于时间的变化函数,求出任意时刻对应的一阶导数值,同时结合lng液位传感器监测数据,将其作为特征值,能够较好的反应出lng温度上升对应的热量。
46.相变热部分数据预处理,相变热部分数据预处理是将lng储罐内相变吸热部分采集的所有数据划分为两个子数据集依次进行数据预处理,包括储罐气相空间温度、压力、高度变化部分数据预处理、压缩机抽气量部分数据预处理,并且分别提取第五特征值x5和第六特征值x6。
47.储罐气相空间温度、压力和高度变化部分数据预处理,基于下面计算方程,通过lng储罐内部气相空间绝对压力与其高度、温度倒数乘积的变化率来衡量lng储罐内部气相物质的量的变化率,即单位时间内lng储罐内部气相物质的量的变化量,提取第五特征值x5:。
48.基于气相状态方程:其中,表示气相压力,pa;vg表示气相体积,m3;z表示压缩因子;r表示摩尔气体常数,;tg表示bog温度,k;h
tank
表示储罐高度,m;ng表示储罐内气相空间的bog物质的量,mol。
49.推导出单位时间内lng储罐压力、温度、高度变化引起的bog物质的量变化量:其中,表示气相压力,pa;z表示压缩因子;r表示摩尔气体常数,;tg表示bog温度,k;h
tank
表示储罐高度,m;ng表示储罐内气相空间的bog物质的量,mol。
50.可以看出,r、r为常数,z波动不大,忽略z的变化,故上式可以表示为如下形式:其中,为π、r2、和的乘积。
51.基于以上预处理操作,梳理出第五特征值x5的表达方式,即,保证第五特征值x5能够与现场数据测量点对应。其中,为绝对压力,由储罐内部气相压力监测点得到;l为lng液位高度由储罐内lng液位传感器监测得到;tg为bog温度由储罐内bog温度监测点得到。
52.根据储罐内部气相压力监测点与其lng液位传感器、bog温度监测点数据倒数乘积的变化及时间,可拟合出其关于时间的变化函数,求出任意时刻对应的一阶导数值,将其作为特征值,能够较好的反应出单位时间内lng储罐内部气相物质的量的变化量。
53.压缩机抽吸气量部分数据预处理,基于下面计算方程,通过压缩机出口压力与其出口流量、出口温度倒数的乘积来衡量压缩机从储罐抽吸向外排出的bog物质的量变化率,即单位时间内压缩机从储罐抽吸向外排出的bog的物质的量的变化量,提取第六特征值x6:。
54.其中,n
dis
表示压缩机从储罐抽吸向外排出的bog物质的量,mol;表示压缩机出口压力,mpa。
55.可以看出,r为常数,z波动不大,忽略z的变化,故上式可表示为如下形式:其中,为和的乘积。
56.基于以上预处理操作,梳理出特征值x6的表达方式,即压缩机出口压力与其出口流量、出口温度倒数的乘积,保证特征值x6能够与现场数据测量点对应。其中,p
dis
由现场压缩机出口压力传感器监测获取,q
dis
由现场压缩机出口流量传感器监测获取,t
dis
由现场压缩机出口温度传感器监测获取。
57.为了验证本实施例中方法的效果,本实施例进行了实验结果说明,具体为:lng储罐运行数据中的原始特征值x1~x7主要包括tw、t
l
、q
p
、l、p
dis
、q
dis
和t
dis
,本实施例中,以特征值q
dis
即压缩机出口排量作为标签y,剩余七组特征值作为输入变量x1~x7构建数据模型;在其他实施例中,还可以以其他一个或多个特征值为标签,以其他特征值为输入变量进行数据模型的构建。
58.热平衡物理模型为:热平衡物理模型为:其中,hpt为相变热,j mol。
59.基于本专利的数据预处理方法,提取出特征值,即t
w-t
l
、qi(t
i-t
l
)、q
p
、、
和,本实施例中,以即压缩机从储罐抽吸向外排出的bog物质的量变化率作为标签y,剩余五组特征值作为输入变量x1~x5构建数据模型;可以理解的,标签y为机器学习输出的结果,是试图预测的目标,选择做标签的物理意义:预测lng罐外bog物质的量变化率;在其他实施例中,还可以以其他一个或多个特征值为标签,以其他特征值为输入变量进行数据模型的构建。其中,采用梯度提升回归(gradient boosting regression,gbr)方法进行拟合,如图1所示,为采用梯度提升回归方法拟合后的原始特征拟合效果图;如图2所示,为采用梯度提升回归方法拟合后的重组特征值后拟合效果图;利用误差指标决定系数r2、最大相对误差max relative error、平均相对误差mean relative error评判预测性能,原始特征与重组特征值后拟合效果对比如表1所示:表1. 原始特征拟合与重组特征值后拟合效果对比 最大相对误差误差指标决定系数r2平均相对误差原始特征拟合442.424%0.8434.742%重组特征值后拟合37.801%0.9084.045%实施例2:本实施例提供了一种用于液化天然气储罐运行数据挖掘的数据处理系统,包括:特征值构建模块,被配置为:根据储罐内温度和储罐外温度的差值,得到第一特征值;根据进料液化天然气温度和储罐内液化天然气温度的差值,得到第二特征值;基于设备运行参数,构建第三特征值;根据罐内液化天然气温度对时间的导数,得到第四特征值;根据罐内气相物理状态参数与体积相关参数的代数运算结果对时间的导数,得到第五特征值;根据压缩机出口气相物理状态参数和排量的代数运算,得到第六特征值;数据拟合模块,被配置为:根据机器学习算法,以所述第一特征值、所述第二特征值、所述第三特征值、所述第四特征值、所述第五特征值和所述第六特征值中的一个或多个特征值为标签,其他特征值为输入进行数据拟合;所述系统的工作方法与实施例1的用于液化天然气储罐运行数据挖掘的数据处理方法相同,这里不再赘述。
60.以上所述仅为本实施例的优选实施例而已,并不用于限制本实施例,对于本领域的技术人员来说,本实施例可以有各种更改和变化。凡在本实施例的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本实施例的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1