一种小样本条件下管道微弱泄漏检测方法与流程

文档序号:19280856发布日期:2019-11-29 22:55阅读:319来源:国知局
一种小样本条件下管道微弱泄漏检测方法与流程

本发明涉及管道泄漏检测技术领域,尤其涉及一种少量样本条件下管道微弱泄漏检测方法。



背景技术:

管道运输是油气资源的主要运输方式,其安全稳定运行具有重大意义,对油气传输过程中的管道小泄漏的精确检测是保障管道安全稳定运行的一种切实有效的手段。近年来,机器学习方法在数据驱动建模方面得到广泛应用,但是也存在一些弊端;

在管道微弱泄漏检测时,存在着如下两个问题:

(1)实际生产过程中,微弱泄漏的样本较少,无法满足机器学习对于高精度建模的需求,而微弱泄漏往往也会导致较为严重的后果,是必须要准确检测并及时处理的。

(2)微弱泄漏信号的特征往往比较隐晦,传统的特征提取方法对于特征的挖掘不够充分,无法满足高精度微弱泄漏辨识模型的需求。



技术实现要素:

本发明要解决的技术问题是针对上述现有技术的不足,提供一种小样本条件下管道微弱泄漏检测方法,本方法从增加微弱泄漏样本数量和深度挖掘微弱泄漏样本特征两方面来构造微弱泄漏辨识模型,大大提高了管道微弱泄漏的检测准确率,保障输油管道的安全运行。

为解决上述技术问题,本发明所采取的技术方案是:

本发明提供一种小样本条件下管道微弱泄漏检测方法,包括如下步骤:

步骤1:获取真实样本集,并根据真实样本集生成虚拟样本集,所述真实样本集包括真实正常样本集xn和真实微弱泄漏样本集xs,所述虚拟样本集包括初代虚拟正常样本集gn和初代虚拟微弱泄漏样本集gs

步骤2:对真实样本集和虚拟样本集进行组合特征提取,所述组合特征提取包括7种统计特征和1组符号化变换特征;

步骤3:根据步骤2中得到的7种统计特征和1组符号化变换特征采用朴素贝叶斯方法和最小二乘支持向量机方法分别建立朴素贝叶斯网络管道小泄漏辨识模型和最小二乘支持向量机管道小泄漏辨识模型,根据辨识模型对管道进行泄漏检测。

所述步骤1具体步骤如下:

步骤1.1:获取真实样本集xn,并根据该样本集中的真实正常样本生成粗糙的虚拟正常样本,生成粗糙的虚拟正常样本集

通过对真实正常样本集内的样本进行统计分析、数据的拟合、相似性的评价的分析,发现已知真实正常样本的数据规律,生成粗糙的虚拟正常样本

其中t表示时间,即样本的检测长度,t={1,2,…,l};k1表示真实正常样本的斜率;ε为传输过程中各种噪声引起的数据波动;yo1为设定的压力初值,该值根据输油管道正常的压力范围设定;

步骤1.2:根据正常样本的约束对步骤1.1中生成的粗糙虚拟正常样本集内的数据进行调整,将不符合约束条件的样本剔除,生成初代虚拟正常样本集

其中根据正常样本约束,虚拟正常样本满足:

其中,表示粗糙虚拟正常样本gn内样本的最小取值和最大取值,t(gn)代表粗糙的虚拟正常样本xn′的检测长度;tmin、tmax表示粗糙的虚拟正常样本的最小检测长度和最大检测长度;表示任意正常样本xn中元素的最小波动,表示任意正常样本的均值,代表常数,表示任意正常样本xn中元素的最大波动,代表常数,σ1表示泄漏报警阈值,△ymin表示强干扰信号的最小值;表示正常样本波动的最大值;

步骤1.3:根据真实微弱泄漏样本约束对初代虚拟正常样本集内的数据进行调整,将不符合真实微弱泄漏样本约束条件的样本剔除,生成初代虚拟微弱泄漏样本集

根据真实微弱泄漏样本约束,虚拟微弱泄漏样本满足:

其中,表示虚拟微弱泄漏样本集gs内样本的最小取值和最大取值;表示虚拟微弱泄漏样本集gs内样本的最小检测长度和最大检测长度;表示虚拟微弱泄漏样本中元素的最小取值,表示任意小泄漏样本的均值,代表常数,表示虚拟微弱泄漏样本中元素的最大取值,代表常数,σ2表示正常样本数据波动的最大值;△gs表示虚拟微弱泄漏的数据波动;△z表示工况调整引起数据波动的最小值;

步骤1.4:根据皮尔森相关系数ρ和真实正常样本集xn对初代虚拟正常样本集gn中的每一个虚拟正常样本进行筛选,若筛选合格,则保留虚拟正常样本,若不合格,则剔除;根据皮尔森相关系数ρ和真实微弱泄漏样本集xs对初代虚拟微弱泄漏样本集gs中的每一个虚拟微弱泄漏样本进行筛选,若筛选合格,则保留虚拟正常样本,若不合格,则剔除;得到虚拟正常样本集和虚拟微弱泄漏样本集

所述步骤1.4中筛选方法为根据皮尔森相关系数公式计算初代虚拟正常样本与真实正常样本集xn内的每一个真实正常样本的皮尔森相关系数ρ,若ρ∈[0.6,0.8],则认为合格,,将初代虚拟正常样本集gn内的每一个虚拟正常样本按照筛选方法逐一计算;根据皮尔森相关系数公式计算初代虚拟微弱泄漏样本与真实微弱泄漏样本集xs内的每一个真实正常样本的皮尔森相关系数ρ,若ρ∈[0.6,0.8],则认为合格,将虚拟微弱泄漏样本集gs内的每一个虚拟微弱泄漏样本按照筛选方法逐一计算;

所述皮尔森相关系数公式如下:

其中,xu表示任意的真实样本,其中u=(n,s);e(·)为期望计算;表示样本xu的均值;gu表示任意的生成样本,表示样本gu的均值;表示样本xu内的第a个元素;表示样本gu内的第l个元素。

所述步骤2具体步骤如下:

步骤2.1:分别对真实正常样本集xn、真实微弱泄漏样本集xs、虚拟正常样本集gn′、虚拟微弱泄漏样本集gs′提取7种统计特征,得到真实正常样本的统计特征集合h={v1、v2、…、vξ},真实微弱泄漏样本的统计特征集合h′={v′1、v′2、…、v′ζ};虚拟正常样本的统计特征集合j={d1、d2、…、dn};虚拟微弱泄漏样本的统计特征集合j′={d′1、d′2、…、d′q};其中,vξ代表第ξ个真实正常样本的统计特征集合,v′ξ代表第ζ个真实微弱泄漏样本的统计特征集合,dn代表第n个虚拟正常样本的统计特征集合,d′q代表第q个虚拟微弱泄漏样本的统计特征集合;所述统计特征包括提取l周期内的最大压力上升信息fmpr、提取l周期内的最大压力下降信息fmpd、提取样本的峰谷值信息fpv、提取样本的变异系数fcv、提取信号幅值的方根信息fsra、提取均方根信息frms、提取拟合系数的最大、最小值的集合ffc;

表达式如下;

提取l1时间间隔内内样本的最大压力上升信息

其中,代表样本集r内的第r个样本;其中r={xn、xs、gn′、gs′},r={1、2、…、θr},所述θr代表样本集r内的样本总数;表示样本的均值,bu表示样本的第u个元素,代表样本内的元素总数;

提取l1时间间隔内内样本的最大压力下降信息

提取样本的峰谷值信息

提取样本的变异系数

其中表示样本的方差;

提取样本信号幅值的方根信息

提取样本均方根信息

提取样本的l2周期的线性拟合系数最大值和最小值的集合

其中fit(al2)表示样本中l2个连续元素的线性拟合系数,l2∈l;

步骤2.2:分别对真实正常样本集xn、真实微弱泄漏样本集xs、虚拟正常样本集gn′、虚拟微弱泄漏样本集gs′内的每个样本提取符号化变换特征fst,得到真实正常样本的符号化变换特征集合f={λ1、λ2、…、λξ},真实微弱泄漏样本的符号化变换特征集合f′={λ′1、λ′2、…、λ′ζ},虚拟正常样本的符号化变换特征集合t={β1、β2、…、βn},虚拟微弱泄漏样本的符号化变换特征集合t′={β′1、β′2、…、β′q};

提取方法为对样本计算其转移概率矩阵通过最大熵分割方法对样本变换得到根据得到的一维向量重复本提取方法提取所有样本的符号化变换特征;计算转移概率矩阵

其中pηy表示样本中元素从状态η变化到状态y的概率;

进行变形,其中pη+表示样本中元素从状态η往上变化的概率,pη-表示样本中元素从状态η往下变化的概率;变形后记为

变换成一维向量

对样本集{xn、xs、gn′、gs′}中每一个样本执行步骤2-2的特征提取操作,直至完成所有样本的特征提取;

步骤2.3:将真实正常样本的统计特征集合与真实正常样本的符号化变换特征集合内的特征进行融合,得到真实正常样本的融合特征集合将真实微弱泄漏样本的统计特征集合与真实微弱泄漏样本的符号化变换特征集合内的特征进行融合,得到真实微弱泄漏样本的融合特征集合将虚拟正常样本的统计特征集合与虚拟正常样本的符号化变换特征集合内的特征进行融合,得到虚拟正常样本的融合特征集合将虚拟微弱泄漏样本的统计特征集合与虚拟微弱泄漏样本的符号化变换特征集合第n个虚拟正常样本的特征融合为:

步骤2.4:获取未知运行状态的真实样本集合重复步骤2.1至步骤2.3,得到未知运行状态的真实样本的融合特征集合

所述步骤3具体步骤如下:

步骤3.1:根据步骤2得到的fxn、fxs、fgn、fgs以及带有样本标签的l′(xn,xs,gn′,gs′)作为朴素贝叶斯网络管道小泄漏辨识模型的输入和输出,朴素贝叶斯网络管道小泄漏辨识模型如下:

其中代表最大准确率的模型;代表输出带有标签的真实样本集合x*;输出“0”代表带有小泄漏样本标签的样本,输出“1”代表带有正常样本标签的样本;

步骤3.2:根据步骤2得到的fxn、fxs、fgn、fgs以及带有样本标签的l′(xn,xs,gn′,gs′)作为最小二乘支持向量机管道小泄漏辨识模型的输入和输出,最小二乘支持向量机管道小泄漏辨识模型如下:

采用上述技术方案所产生的有益效果在于:本发明提供的一种小样本条件下管道微弱泄漏检测方法,可有效解决管道传输过程中面临的微弱泄漏难以检测的问题;本方法中的组合特征提取方法能够全方位的提取小泄漏信息,使得特征向量对于小泄漏的表征更加充分;本方法从增加微弱泄漏样本数量和深度挖掘微弱泄漏样本特征两方面来构造微弱泄漏辨识模型,大大提高了管道微弱泄漏的检测准确率,保障输油管道的安全运行。

附图说明

图1为本发明实施例提供的小样本条件下的管道微弱泄漏检测流程图;

图2为本发明实施例提供的样本的组合特征提取流程图;

图3为本发明实施例提供的建立两种微弱泄漏辨识模型框图;

图4为本发明实施例提供的生成虚拟样本的测试结果图;

图5为本发明实施例提供的真实管道微弱泄漏的测试结果图,其中,a为朴素贝叶斯网络模型真实管道微弱泄漏的测试结果图,b为最小二乘支持向量机模型真实管道微弱泄漏的测试结果图。

具体实施方式

下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。

如图1所示,本实施例的方法如下所述。

采用压力变送器采集油气传输过程中管道的压力信息,并人工选取少量的正常样本和微弱泄漏样本,因为实际生产中微弱泄漏样本出现概率低,数量少,无法满足建立精确模型的要求。故本发明提供一种小样本条件下管道微弱泄漏检测方法,包括如下步骤:

步骤1:获取真实样本集,并根据真实样本集生成虚拟样本集,所述真实样本集包括真实正常样本集xn和真实微弱泄漏样本集xs,所述虚拟样本集包括初代虚拟正常样本集gn和初代虚拟微弱泄漏样本集gs;具体步骤如下:

步骤1.1:获取真实样本集xn,并根据该样本集中的真实正常样本生成粗糙的虚拟正常样本,生成粗糙的虚拟正常样本集

通过对真实正常样本集内的样本进行统计分析、数据的拟合、相似性的评价等分析,发现已知真实正常样本的数据规律,生成粗糙的虚拟正常样本

其中t表示时间,即样本的检测长度,t={1,2,…,l};k1表示真实正常样本的斜率;ε为传输过程中各种噪声引起的数据波动;yo1为设定的压力初值,该值根据输油管道正常的压力范围设定;

所述样本的分析思路如下:通过对于海量的正常样本分析以及我们的领域知识(长期从事管道泄漏检测方面的研究,对于管道压力数据有着比较深刻的了解)近似得到粗糙的与真实正常样本规律类似的虚拟正常样本生成模型,我们的数据库中包含了海量的正常样本,之所以先做了正常样本的生成,原因有三点:降低人工采样的成本,费时、费力;验证生成方法的有效性;小泄漏都是在正常样本的基础上进行衍化的。我们对于数据的分析包括:正常样本的统计分析、数据的拟合、相似性的评价等,最终实现三个目的:获取压力数据的量级——即正常生产过程中管道压力的合理范围;压力随着时间的衰减系数,即k1的取值;噪声引起的压力波动ε;

步骤1.2:根据正常样本的约束对步骤1.1中生成的粗糙虚拟正常样本集内的数据进行调整,将不符合约束条件的样本剔除,生成初代虚拟正常样本集

其中根据正常样本约束,虚拟正常样本满足:

其中表示粗糙虚拟正常样本gn内样本的最小取值和最大取值,t(gn)代表粗糙的虚拟正常样本xn′的检测长度;tmin、tmax表示粗糙的虚拟正常样本的最小检测长度和最大检测长度;表示任意正常样本xn中元素的最小波动,表示任意正常样本的均值,代表常数,表示任意正常样本xn中元素的最大波动,代表常数,σ1表示泄漏报警阈值,△ymin表示强干扰信号的最小值;表示正常样本波动的最大值;

步骤1.3:根据真实微弱泄漏样本约束对初代虚拟正常样本集内的数据进行调整,将不符合真实微弱泄漏样本约束条件的样本剔除,生成初代虚拟微弱泄漏样本集

根据真实微弱泄漏样本约束,虚拟微弱泄漏样本满足:

其中,表示虚拟微弱泄漏样本集gs内样本的最小取值和最大取值;表示虚拟微弱泄漏样本集gs内样本的最小检测长度和最大检测长度;表示虚拟微弱泄漏样本中元素的最小取值,表示任意小泄漏样本的均值,代表常数,表示虚拟微弱泄漏样本中元素的最大取值,代表常数,σ2表示正常样本数据波动的最大值,所谓的正常样本数据是指小泄漏样本发生前后那段时间的正常样本,其波动是小于小泄漏发生时的数据波动的;△gs表示虚拟微弱泄漏的数据波动;△z表示工况调整引起数据波动的最小值;

步骤1.4:根据皮尔森相关系数ρ和真实正常样本集xn对初代虚拟正常样本集gn中的每一个虚拟正常样本进行筛选,若筛选合格,则保留虚拟正常样本,若不合格,则剔除;根据皮尔森相关系数ρ和真实微弱泄漏样本集xs对初代虚拟微弱泄漏样本集gs中的每一个虚拟微弱泄漏样本进行筛选,若筛选合格,则保留虚拟正常样本,若不合格,则剔除;得到得到虚拟正常样本集和虚拟微弱泄漏样本集本发明中ρ的下限为0.6,ρ的上限为0.8,这样就使得生成的样本与有限个真实的样本既存在统计学上的相似性,又有一定的差异性,有效解决了工程中的小样本问题。

所述筛选方法为根据皮尔森相关系数公式计算初代虚拟正常样本与真实正常样本集xn内的每一个真实正常样本的皮尔森相关系数ρ,若ρ∈[0.6,0.8],则认为合格,将初代虚拟正常样本集gn内的每一个虚拟正常样本按照筛选方法逐一计算;根据皮尔森相关系数公式计算初代虚拟微弱泄漏样本与真实微弱泄漏样本集xs内的每一个真实正常样本的皮尔森相关系数ρ,若ρ∈[0.6,0.8],则认为合格,将初代虚拟微弱泄漏样本集gs内的每一个虚拟微弱泄漏样本按照筛选方法逐一计算;

所述皮尔森相关系数公式如下:

其中,xu表示任意的真实样本,其中u=(n,s);e(·)为期望计算;表示样本xu的均值;gu表示任意的生成样本,表示样本gu的均值;表示样本xu内的第a个元素;表示样本gu内的第l个元素。

步骤2:对真实样本集和虚拟样本集进行组合特征提取,所述组合特征提取包括7种统计特征和1组符号化变换特征;如图2所示,具体步骤如下:

步骤2.1:分别对真实正常样本集xn、真实微弱泄漏样本集xs、虚拟正常样本集gn′、虚拟微弱泄漏样本集gs′提取7种统计特征,得到真实正常样本的统计特征集合h={v1、v2、…、vξ},真实微弱泄漏样本的统计特征集合h′={v′1、v′2、…、v′ζ};虚拟正常样本的统计特征集合j={d1、d2、…、dn};虚拟微弱泄漏样本的统计特征集合j′={d′1、d′2、…、d′q};其中,vξ代表第ξ个真实正常样本的统计特征集合,v′ξ代表第ζ个真实微弱泄漏样本的统计特征集合,dn代表第n个虚拟正常样本的统计特征集合,d′q代表第q个虚拟微弱泄漏样本的统计特征集合;所述统计特征包括提取l周期内的最大压力上升信息fmpr、提取l周期内的最大压力下降信息fmpd、提取样本的峰谷值信息fpv、提取样本的变异系数fcv、提取信号幅值的方根信息fsra、提取均方根信息frms、提取拟合系数的最大、最小值的集合ffc;

对样本进行充分挖掘,各种特征的表达式如下;

提取l1时间间隔内内样本的最大压力上升信息

其中,代表样本集r内的第r个样本;其中r={xn、xs、gn′、gs′},r={1、2、…、θr},所述θr代表样本集r内的样本总数;表示样本的均值,bu表示样本的第u个元素,代表样本内的元素总数;

提取l1时间间隔内内样本的最大压力下降信息

提取样本的峰谷值信息

提取样本的变异系数

其中表示样本的方差;

提取样本信号幅值的方根信息

提取样本均方根信息

提取样本的l2周期的线性拟合系数最大值和最小值的集合

其中fit(al2)表示样本中l2个连续元素的线性拟合系数,l2∈l;

步骤2.2:分别对真实正常样本集xn、真实微弱泄漏样本集xs、虚拟正常样本集gn′、虚拟微弱泄漏样本集gs′内的每个样本提取符号化变换特征fst,得到真实正常样本的符号化变换特征集合f={λ1、λ2、…、λξ},真实微弱泄漏样本的符号化变换特征集合f′={λ′1、λ′2、…、λ′ζ},虚拟正常样本的符号化变换特征集合t={β1、β2、…、βn},虚拟微弱泄漏样本的符号化变换特征集合t′={β′1、β′2、…、β′q};

提取方法为对样本计算其转移概率矩阵通过最大熵分割方法对样本变换得到根据得到的一维向量重复本提取方法提取所有样本的符号化变换特征,即其中表示第ξ个真实正常样本,表示生成的第i个虚拟正常样本,sξ、表示真实正常样本的变换向量和虚拟正常样本的变换向量;计算转移概率矩阵

其中pηy表示样本中元素从状态η变化到状态y的概率;

为解决的维数灾难,进行变形,其中pη+表示样本中元素从状态η往上变化的概率,pη-表示样本中元素从状态η往下变化的概率;变形后记为

最后,将变换成一维向量

对样本集{xn、xs、gn′、gs′}中每一个样本执行步骤2-2的特征提取操作,实现所有样本的特征提取工作。

步骤2.3:将真实正常样本的统计特征集合与真实正常样本的符号化变换特征集合内的特征进行融合,得到真实正常样本的融合特征集合将真实微弱泄漏样本的统计特征集合与真实微弱泄漏样本的符号化变换特征集合内的特征进行融合,得到真实微弱泄漏样本的融合特征集合将虚拟正常样本的统计特征集合与虚拟正常样本的符号化变换特征集合内的特征进行融合,得到虚拟正常样本的融合特征集合将虚拟微弱泄漏样本的统计特征集合与虚拟微弱泄漏样本的符号化变换特征集合完成从原始数据域到特征域的变换。

第n个虚拟正常样本的特征融合为:

步骤2.4:获取未知运行状态的真实样本集合重复步骤2.1至步骤2.3,得到未知运行状态的真实样本的融合特征集合

步骤3:根据步骤2中得到的7种统计特征和1组符号化变换特征分别采用朴素贝叶斯方法和最小二乘支持向量机方法分别建立朴素贝叶斯网络管道小泄漏辨识模型和最小二乘支持向量机管道小泄漏辨识模型,根据辨识模型对管道进行泄漏检测,实现对于管道小泄漏的精确检测。因为小泄漏样本的数量通常较少,无法建立较为精确的小泄漏识别模型,因此传统的泄漏检测方法会存在漏报率高(泄漏报警灵敏度太低情况下)或者误报率高(泄漏报警灵敏度太高情况下)的问题,本发明中的第一个工作就是解决小泄漏样本数量少的问题;[2]小泄漏样本的特征不明显,传统的特征提取方法对于小泄漏样本的挖掘不够充分,本发明中的组合特征提取方法能够全方位的提取小泄漏信息,使得特征向量对于小泄漏的表征更加充分。所以建立精确的小泄漏识别模型,实现对于小泄漏的准确辨识、精确检测;如图3所示,具体包括:

步骤3.1:根据步骤2得到的fxn、fxs、fgn、fgs以及带有样本标签的l′(xn,xs,gn′,gs′)作为朴素贝叶斯网络管道小泄漏辨识模型的输入和输出,朴素贝叶斯网络管道小泄漏辨识模型(即微弱泄漏辨识模型1)如下:

其中代表最大准确率的模型;代表输出带有标签的真实样本集合x*;输出“0”代表带有小泄漏样本标签的样本,输出“1”代表带有正常样本标签的样本;

步骤3.2:根据步骤2得到的fxn、fxs、fgn、fgs以及带有样本标签的l′(xn,xs,gn′,gs′)作为最小二乘支持向量机管道小泄漏辨识模型的输入和输出,最小二乘支持向量机管道小泄漏辨识模型(即微弱泄漏辨识模型2)如下:

本实施例中对模型可靠性进行测试。本发明实施实例分别以生成的虚拟样本和真实的微弱泄漏样本对本发明中的模型进行测试。

由于实际生产过程中微弱泄漏出现频率低,我们从历史数据中采集了40个微弱泄漏样本,为保持正负样本的平衡,正常样本亦选取50,用本发明中设计的虚拟样本生成方法,生成1000个虚拟正常样本和1000个虚拟微弱泄漏样本。参数选择如下:训练样本长度l=120,当使用朴素贝叶斯方法时符号化变换的分割参数n=5,当使用最小二乘支持向量机时符号化变化的分割参数n=4。

如图4所示,本发明提出的两种方法在虚拟样本中的测试结果,从结果中可以发现模型的准确率很高,说明了本发明的有效性。

如图5所示,为使用80个真实样本测试时的结果,可以看出,使用朴素贝叶斯方法时有5个样本(no.10,no.22,no.23,no.36和no.47)被误诊,测试准确率为93.75%。使用最小二乘支持向量机时,仅有4个样本(no.10,no.23,no.36和no.47)被误诊,测试准确率高达95%。这充分说明了本发明中所设计的方法有效性。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明权利要求所限定的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1