本发明涉及管道泄漏检测技术领域,尤其涉及一种少量样本条件下管道微弱泄漏检测方法。
背景技术:
管道运输是油气资源的主要运输方式,其安全稳定运行具有重大意义,对油气传输过程中的管道小泄漏的精确检测是保障管道安全稳定运行的一种切实有效的手段。近年来,机器学习方法在数据驱动建模方面得到广泛应用,但是也存在一些弊端;
在管道微弱泄漏检测时,存在着如下两个问题:
(1)实际生产过程中,微弱泄漏的样本较少,无法满足机器学习对于高精度建模的需求,而微弱泄漏往往也会导致较为严重的后果,是必须要准确检测并及时处理的。
(2)微弱泄漏信号的特征往往比较隐晦,传统的特征提取方法对于特征的挖掘不够充分,无法满足高精度微弱泄漏辨识模型的需求。
技术实现要素:
本发明要解决的技术问题是针对上述现有技术的不足,提供一种小样本条件下管道微弱泄漏检测方法,本方法从增加微弱泄漏样本数量和深度挖掘微弱泄漏样本特征两方面来构造微弱泄漏辨识模型,大大提高了管道微弱泄漏的检测准确率,保障输油管道的安全运行。
为解决上述技术问题,本发明所采取的技术方案是:
本发明提供一种小样本条件下管道微弱泄漏检测方法,包括如下步骤:
步骤1:获取真实样本集,并根据真实样本集生成虚拟样本集,所述真实样本集包括真实正常样本集xn和真实微弱泄漏样本集xs,所述虚拟样本集包括初代虚拟正常样本集gn和初代虚拟微弱泄漏样本集gs;
步骤2:对真实样本集和虚拟样本集进行组合特征提取,所述组合特征提取包括7种统计特征和1组符号化变换特征;
步骤3:根据步骤2中得到的7种统计特征和1组符号化变换特征采用朴素贝叶斯方法和最小二乘支持向量机方法分别建立朴素贝叶斯网络管道小泄漏辨识模型和最小二乘支持向量机管道小泄漏辨识模型,根据辨识模型对管道进行泄漏检测。
所述步骤1具体步骤如下:
步骤1.1:获取真实样本集xn,并根据该样本集中的真实正常样本生成粗糙的虚拟正常样本,生成粗糙的虚拟正常样本集
通过对真实正常样本集内的样本进行统计分析、数据的拟合、相似性的评价的分析,发现已知真实正常样本的数据规律,生成粗糙的虚拟正常样本
其中t表示时间,即样本的检测长度,t={1,2,…,l};k1表示真实正常样本的斜率;ε为传输过程中各种噪声引起的数据波动;yo1为设定的压力初值,该值根据输油管道正常的压力范围设定;
步骤1.2:根据正常样本的约束对步骤1.1中生成的粗糙虚拟正常样本集内的数据进行调整,将不符合约束条件的样本剔除,生成初代虚拟正常样本集
其中根据正常样本约束,虚拟正常样本
其中,
步骤1.3:根据真实微弱泄漏样本约束对初代虚拟正常样本集
根据真实微弱泄漏样本约束,虚拟微弱泄漏样本
其中,
步骤1.4:根据皮尔森相关系数ρ和真实正常样本集xn对初代虚拟正常样本集gn中的每一个虚拟正常样本进行筛选,若筛选合格,则保留虚拟正常样本,若不合格,则剔除;根据皮尔森相关系数ρ和真实微弱泄漏样本集xs对初代虚拟微弱泄漏样本集gs中的每一个虚拟微弱泄漏样本进行筛选,若筛选合格,则保留虚拟正常样本,若不合格,则剔除;得到虚拟正常样本集
所述步骤1.4中筛选方法为根据皮尔森相关系数公式计算初代虚拟正常样本
所述皮尔森相关系数公式如下:
其中,xu表示任意的真实样本,其中u=(n,s);e(·)为期望计算;
所述步骤2具体步骤如下:
步骤2.1:分别对真实正常样本集xn、真实微弱泄漏样本集xs、虚拟正常样本集gn′、虚拟微弱泄漏样本集gs′提取7种统计特征,得到真实正常样本的统计特征集合h={v1、v2、…、vξ},真实微弱泄漏样本的统计特征集合h′={v′1、v′2、…、v′ζ};虚拟正常样本的统计特征集合j={d1、d2、…、dn};虚拟微弱泄漏样本的统计特征集合j′={d′1、d′2、…、d′q};其中,vξ代表第ξ个真实正常样本的统计特征集合,v′ξ代表第ζ个真实微弱泄漏样本的统计特征集合,dn代表第n个虚拟正常样本的统计特征集合,d′q代表第q个虚拟微弱泄漏样本的统计特征集合;所述统计特征包括提取l周期内的最大压力上升信息fmpr、提取l周期内的最大压力下降信息fmpd、提取样本的峰谷值信息fpv、提取样本的变异系数fcv、提取信号幅值的方根信息fsra、提取均方根信息frms、提取拟合系数的最大、最小值的集合ffc;
表达式如下;
提取l1时间间隔内内样本
其中,
提取l1时间间隔内内样本
提取样本
提取样本
其中
提取样本
提取样本
提取样本
其中fit(al2)表示样本
步骤2.2:分别对真实正常样本集xn、真实微弱泄漏样本集xs、虚拟正常样本集gn′、虚拟微弱泄漏样本集gs′内的每个样本提取符号化变换特征fst,得到真实正常样本的符号化变换特征集合f={λ1、λ2、…、λξ},真实微弱泄漏样本的符号化变换特征集合f′={λ′1、λ′2、…、λ′ζ},虚拟正常样本的符号化变换特征集合t={β1、β2、…、βn},虚拟微弱泄漏样本的符号化变换特征集合t′={β′1、β′2、…、β′q};
提取方法为对样本
其中pηy表示样本中元素从状态η变化到状态y的概率;
进行
将
对样本集{xn、xs、gn′、gs′}中每一个样本执行步骤2-2的特征提取操作,直至完成所有样本的特征提取;
步骤2.3:将真实正常样本的统计特征集合与真实正常样本的符号化变换特征集合内的特征进行融合,得到真实正常样本的融合特征集合
步骤2.4:获取未知运行状态的真实样本集合
所述步骤3具体步骤如下:
步骤3.1:根据步骤2得到的fxn、fxs、fgn、fgs、
其中
步骤3.2:根据步骤2得到的fxn、fxs、fgn、fgs、
采用上述技术方案所产生的有益效果在于:本发明提供的一种小样本条件下管道微弱泄漏检测方法,可有效解决管道传输过程中面临的微弱泄漏难以检测的问题;本方法中的组合特征提取方法能够全方位的提取小泄漏信息,使得特征向量对于小泄漏的表征更加充分;本方法从增加微弱泄漏样本数量和深度挖掘微弱泄漏样本特征两方面来构造微弱泄漏辨识模型,大大提高了管道微弱泄漏的检测准确率,保障输油管道的安全运行。
附图说明
图1为本发明实施例提供的小样本条件下的管道微弱泄漏检测流程图;
图2为本发明实施例提供的样本的组合特征提取流程图;
图3为本发明实施例提供的建立两种微弱泄漏辨识模型框图;
图4为本发明实施例提供的生成虚拟样本的测试结果图;
图5为本发明实施例提供的真实管道微弱泄漏的测试结果图,其中,a为朴素贝叶斯网络模型真实管道微弱泄漏的测试结果图,b为最小二乘支持向量机模型真实管道微弱泄漏的测试结果图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
如图1所示,本实施例的方法如下所述。
采用压力变送器采集油气传输过程中管道的压力信息,并人工选取少量的正常样本和微弱泄漏样本,因为实际生产中微弱泄漏样本出现概率低,数量少,无法满足建立精确模型的要求。故本发明提供一种小样本条件下管道微弱泄漏检测方法,包括如下步骤:
步骤1:获取真实样本集,并根据真实样本集生成虚拟样本集,所述真实样本集包括真实正常样本集xn和真实微弱泄漏样本集xs,所述虚拟样本集包括初代虚拟正常样本集gn和初代虚拟微弱泄漏样本集gs;具体步骤如下:
步骤1.1:获取真实样本集xn,并根据该样本集中的真实正常样本生成粗糙的虚拟正常样本,生成粗糙的虚拟正常样本集
通过对真实正常样本集内的样本进行统计分析、数据的拟合、相似性的评价等分析,发现已知真实正常样本的数据规律,生成粗糙的虚拟正常样本
其中t表示时间,即样本的检测长度,t={1,2,…,l};k1表示真实正常样本的斜率;ε为传输过程中各种噪声引起的数据波动;yo1为设定的压力初值,该值根据输油管道正常的压力范围设定;
所述样本的分析思路如下:通过对于海量的正常样本分析以及我们的领域知识(长期从事管道泄漏检测方面的研究,对于管道压力数据有着比较深刻的了解)近似得到粗糙的与真实正常样本规律类似的虚拟正常样本生成模型,我们的数据库中包含了海量的正常样本,之所以先做了正常样本的生成,原因有三点:降低人工采样的成本,费时、费力;验证生成方法的有效性;小泄漏都是在正常样本的基础上进行衍化的。我们对于数据的分析包括:正常样本的统计分析、数据的拟合、相似性的评价等,最终实现三个目的:获取压力数据的量级——即正常生产过程中管道压力的合理范围;压力随着时间的衰减系数,即k1的取值;噪声引起的压力波动ε;
步骤1.2:根据正常样本的约束对步骤1.1中生成的粗糙虚拟正常样本集内的数据进行调整,将不符合约束条件的样本剔除,生成初代虚拟正常样本集
其中根据正常样本约束,虚拟正常样本
其中
步骤1.3:根据真实微弱泄漏样本约束对初代虚拟正常样本集
根据真实微弱泄漏样本约束,虚拟微弱泄漏样本
其中,
步骤1.4:根据皮尔森相关系数ρ和真实正常样本集xn对初代虚拟正常样本集gn中的每一个虚拟正常样本进行筛选,若筛选合格,则保留虚拟正常样本,若不合格,则剔除;根据皮尔森相关系数ρ和真实微弱泄漏样本集xs对初代虚拟微弱泄漏样本集gs中的每一个虚拟微弱泄漏样本进行筛选,若筛选合格,则保留虚拟正常样本,若不合格,则剔除;得到得到虚拟正常样本集
所述筛选方法为根据皮尔森相关系数公式计算初代虚拟正常样本
所述皮尔森相关系数公式如下:
其中,xu表示任意的真实样本,其中u=(n,s);e(·)为期望计算;
步骤2:对真实样本集和虚拟样本集进行组合特征提取,所述组合特征提取包括7种统计特征和1组符号化变换特征;如图2所示,具体步骤如下:
步骤2.1:分别对真实正常样本集xn、真实微弱泄漏样本集xs、虚拟正常样本集gn′、虚拟微弱泄漏样本集gs′提取7种统计特征,得到真实正常样本的统计特征集合h={v1、v2、…、vξ},真实微弱泄漏样本的统计特征集合h′={v′1、v′2、…、v′ζ};虚拟正常样本的统计特征集合j={d1、d2、…、dn};虚拟微弱泄漏样本的统计特征集合j′={d′1、d′2、…、d′q};其中,vξ代表第ξ个真实正常样本的统计特征集合,v′ξ代表第ζ个真实微弱泄漏样本的统计特征集合,dn代表第n个虚拟正常样本的统计特征集合,d′q代表第q个虚拟微弱泄漏样本的统计特征集合;所述统计特征包括提取l周期内的最大压力上升信息fmpr、提取l周期内的最大压力下降信息fmpd、提取样本的峰谷值信息fpv、提取样本的变异系数fcv、提取信号幅值的方根信息fsra、提取均方根信息frms、提取拟合系数的最大、最小值的集合ffc;
对样本进行充分挖掘,各种特征的表达式如下;
提取l1时间间隔内内样本
其中,
提取l1时间间隔内内样本
提取样本
提取样本
其中
提取样本
提取样本
提取样本
其中fit(al2)表示样本
步骤2.2:分别对真实正常样本集xn、真实微弱泄漏样本集xs、虚拟正常样本集gn′、虚拟微弱泄漏样本集gs′内的每个样本提取符号化变换特征fst,得到真实正常样本的符号化变换特征集合f={λ1、λ2、…、λξ},真实微弱泄漏样本的符号化变换特征集合f′={λ′1、λ′2、…、λ′ζ},虚拟正常样本的符号化变换特征集合t={β1、β2、…、βn},虚拟微弱泄漏样本的符号化变换特征集合t′={β′1、β′2、…、β′q};
提取方法为对样本
其中pηy表示样本中元素从状态η变化到状态y的概率;
为解决
最后,将
对样本集{xn、xs、gn′、gs′}中每一个样本执行步骤2-2的特征提取操作,实现所有样本的特征提取工作。
步骤2.3:将真实正常样本的统计特征集合与真实正常样本的符号化变换特征集合内的特征进行融合,得到真实正常样本的融合特征集合
第n个虚拟正常样本的特征融合为:
步骤2.4:获取未知运行状态的真实样本集合
步骤3:根据步骤2中得到的7种统计特征和1组符号化变换特征分别采用朴素贝叶斯方法和最小二乘支持向量机方法分别建立朴素贝叶斯网络管道小泄漏辨识模型和最小二乘支持向量机管道小泄漏辨识模型,根据辨识模型对管道进行泄漏检测,实现对于管道小泄漏的精确检测。因为小泄漏样本的数量通常较少,无法建立较为精确的小泄漏识别模型,因此传统的泄漏检测方法会存在漏报率高(泄漏报警灵敏度太低情况下)或者误报率高(泄漏报警灵敏度太高情况下)的问题,本发明中的第一个工作就是解决小泄漏样本数量少的问题;[2]小泄漏样本的特征不明显,传统的特征提取方法对于小泄漏样本的挖掘不够充分,本发明中的组合特征提取方法能够全方位的提取小泄漏信息,使得特征向量对于小泄漏的表征更加充分。所以建立精确的小泄漏识别模型,实现对于小泄漏的准确辨识、精确检测;如图3所示,具体包括:
步骤3.1:根据步骤2得到的fxn、fxs、fgn、fgs、
其中
步骤3.2:根据步骤2得到的fxn、fxs、fgn、fgs、
本实施例中对模型可靠性进行测试。本发明实施实例分别以生成的虚拟样本和真实的微弱泄漏样本对本发明中的模型进行测试。
由于实际生产过程中微弱泄漏出现频率低,我们从历史数据中采集了40个微弱泄漏样本,为保持正负样本的平衡,正常样本亦选取50,用本发明中设计的虚拟样本生成方法,生成1000个虚拟正常样本和1000个虚拟微弱泄漏样本。参数选择如下:训练样本长度l=120,当使用朴素贝叶斯方法时符号化变换的分割参数n=5,当使用最小二乘支持向量机时符号化变化的分割参数n=4。
如图4所示,本发明提出的两种方法在虚拟样本中的测试结果,从结果中可以发现模型的准确率很高,说明了本发明的有效性。
如图5所示,为使用80个真实样本测试时的结果,可以看出,使用朴素贝叶斯方法时有5个样本(no.10,no.22,no.23,no.36和no.47)被误诊,测试准确率为93.75%。使用最小二乘支持向量机时,仅有4个样本(no.10,no.23,no.36和no.47)被误诊,测试准确率高达95%。这充分说明了本发明中所设计的方法有效性。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明权利要求所限定的范围。