基于主成分分析和支持向量机的油气水多相流流型识别方法

文档序号:6554941阅读:154来源:国知局
专利名称:基于主成分分析和支持向量机的油气水多相流流型识别方法
技术领域
本发明涉及多相流测量技术领域,尤其涉及一种基于主成分分析和支持向量机的油气水多相流流型识别方法。
背景技术
传统的流型识别方法有两大类一类是采用实验方法做出流型图;另一类是根据对流型转变机理的分析得到的转变准则关系式,利用现场的流动参数来确定流型。由于在生产实际中流动参数往往是需要解决的问题,因此传统的方法无法得到广泛应用。
流型的现代测量方法从工作原理上可分为直接测量和间接测量方法。常用的直接测量方法有目测法、高速摄影法等,该方法具有一定的主观性,对于多个观察者可能得出不同的结论。间接测量方法是利用测量的仪器设备测量的压力、压差和含气率等波动信号,通过对信号进行分析、提取特征,结合神经网络等模式识别技术来识别流型。该方法有两个关键问题一是流型特征向量的提取;二是网络模型的选取,其中特征提取尤为关键。现有的方法主要是利用单一的压力或压差波动信号来提取信号的单一特征,导致提取的特征无法全面反映流型的信息,致使流型识别率不高。

发明内容
本发明的目的在于克服上述现有技术的缺陷,提出一种流型识别准确性、可靠性高,通用性强的基于主成分分析和支持向量机的油气水多相流流型识别方法。
本发明的目的是由以下技术方案来实现的一种基于主成分分析和支持向量机的油气水多相流流型识别方法,其特征在于,它包括以下步骤(1)对不同流型的流动参数信号进行采集利用取压间距分别为5倍、10倍和15倍管径D;采样频率为256Hz;采样点数为1024点;1个压力变送器和3个不同取压间距的差压变送器对流动参数信号进行实时采集;(2)去除噪声预处理利用小波包对压力和压差波动信号进行去除噪声处理。
(a)对1个压力波动和3个不同取压间距的压差波动信号S1、S2、S3和S4按照下面的递归式(1)进行4层小波包分解u2n(t)=2Σkh(k)un(2t-k)u2n-1(t)=2Σkg(k)un(2t-k)---(1)]]>式中h(k)为高通滤波器组;g(k)为低通滤波器组;u0(t)=(t),为尺度函数;u1(t)=ψ(t),为小波函数;k为分解的尺度。h(k)和g(k)满足正交关系g(k)=(-1)kh(1-k) (2)(b)对分解的各个频带分别设定阈值,采用如下的浮动阈值形式tk=21n(n)σ/n---(3)]]>其中σ为噪声强度,用中位数MAD(υk)/0.6745(υk为小波包分解系数)来估计,n为信号的长度。
(c)用非线性函数ζ=sgn(υk)(|υk|-tk)作用于信号的小波包分解系数υk,得到系数υk,即将浮动阈值以上的系数减去阈值后并保留下来。
(d)由系数υk重建原信号,从而达到去除噪声,得到去除噪声后的信号为S1′、S2′、S3′和S4′。
(3)在对去除噪声后的1个压力和3个压差波动信号S1′、S2′、S3′、S4′进行经验模式分解,提取流型的特征向量。EMD方法从本质上讲是对一个信号进行平稳化处理,其结果是将信号中不同尺度的波动或趋势逐级分解出来,产生一系列具有不同特征尺度的数据序列,每一个序列称为一个固有模态函数IMF。IMF分量必须满足下面两个条件一是其极点数和零点数相同(或最多相差一个),二是其上下包络线关于时间轴局部对称。
EMD方法步骤如下假设任何信号都由不同的IMF组成,每个IMF可以是线性的,也可以是非线性的,这样任何一个信号就可以分解为有限个IMF之和,则IMF可以按以下方法“筛选”(Sift)(a)确定信号x(t)的所有局部极值点,将所有极大值点用三次样条线连接起来形成上包络线,将所有极小值点用三次样条线连接起来形成下包络线,这两条包络线包络了所有的信号数据。
(b)将两条包络线的均值记为μ1,求出y1(t)=x(t)-μ1(4)(c)判断y1(t)是否为IMF,若y1(t)不满足IMF条件,则将y1(t)作为原始数据,此时,记y1(t)=c1(t),则c1(t)为信号x1(t)的第一个IMF分量,它代表信号x1(t)中最高频率的分量;(d)将c1(t)从x1(t)中分离出来,即得到一个去掉高频分量的差值信号r1(t),即有r1(t)=x1(t)-c1(t) (5)将r1(t)作为原始数据,重复步骤(1)、(2)和(3),得到第二个IMF分量c2(t),重复n次,得到n个IMF分量。这样就有r1-c2=r2Mrn-1-cn=rn---(6)]]>
当cn(t)或rn(t)满足给定的终止条件(通常使rn(t)成为一个单调函数)时,循环结束,由(2)式和(3)式可得到x(t)=Σi=1nci(t)+rn(t)---(7)]]>式中,rn(t)为残余函数,代表信号的平均趋势。而各IMF分量c1(t),c2(t),Λ,cn(t)分别包含了信号从高到低不同频率段的成分,每一频率段所包含的频率成分都是不同的,且随信号本身的变化而变化。
(e)特征向量的提取。1个压力波动信号和3个压差波动信号的n个IMF分量分别记为c11(t),c12(t),Λ,c1n1(t)、c21(t),c22(t),Λ,c2n2(t)、c31(t),c32(t),Λ,c3n3(t)、c41(t),c42(t),Λ,c4n4(t)。将这些IMF分量组成一个特这个矩阵X,即Xp×n==x11x12Λx1px21x22Λx2pMMMMxn1xn1ΛxnpT=c11Mc1n1c21Mc2n2c31Mc3n3c41Mc4n4T---(8)]]>式中X为p×n的特征矩阵,p为采样点数,n=n1+n2+n3+n4为4个原始信号的所有IMF分量的个数,xi(i=1,2,Λ,n)为p维向量。
(f)对矩阵X用下式变换为相关矩阵,即主成分矩阵R,并计算出相关矩阵R的m个特征值。
①将原始变量进行标准化各指标量纲往往不同,分析时,不同的量纲和数量级会引出新的问题,故要标准化,使标准化的变量平均值为0,方差为1,即xij*=xij-x‾ivar(xij)]]>i=1,2,Λ,n;j=1,2,Λ,p (9)式中xij*为标准化后的观测量,xi为平均值, 为标准差。
②计算X的相关矩阵R标准化后,相关阵和协方差阵相同,且R的子分量可表示为rij=1nΣi=1nxti*xij*---(10)]]>式中xti*,xij*分别为特征矩阵中第t行第i列与第j列元素。
③求相关矩阵R的特征值及特征向量计算出各特征值(λ1>λ2>Λ>λn)和各特征向量(u1,u2,Λ,un)。
④选择主成分计算各主成分的贡献率及累计贡献率,主成分的个数视具体问题而定,本发明取累计贡献率为90%所对应的m个变量作为主成分。
⑤计算得分根据主成分表达式计算各主成分得分。在主成分分析中,μj=λj/Σi=1mλi]]>为主成分的贡献率,比值 反映前k个主成分所代表的原始数据信息的百分数。令T=[μ1,μ2,Λ,μm] (11)则T为不同流型的特征向量。
(4)支持向量机分类器。采用支持向量机来实现流型的识别。水平管内油气水多相流流型有4种,即分层流、间歇流、泡状流和环状流。根据上述分类情况,采用“一对多”的策略,构造4个二值分类器,对每一个流型构造一个支持向量机,4个支持向量机的输出是一个4维向量,每一个分量表示样本是否对应该流型,训练好的支持向量机可实现对流型的识别。
本发明基于主成分分析和支持向量机的油气水多相流流型识别方法的优点在于1.对1个压力和3个差压变送器的信号进行融合,提取的特征能全面反映流型的信息,因此,识别准确性和可靠性高。
2.采用支持向量机来实现流型的识别,计算速度快,有利于流型的在线识别。


图1是基于主成分分析和支持向量机的油气水多相流流型识别方法流程图。
图2是基于主成分分析和支持向量机的油气水多相流流型信号采集装置的结构示意图。
具体实施例方式
下面利用附图和实施例对本发明基于主成分分析和支持向量机的油气水多相流流型识别方法作进一步说明。
如图2所示,基于主成分分析和支持向量机的油气水多相流流型信号采集装置,具有多相流水平管路16,在多相流水平管路16上套置的取压环1a、2b、3c、4d、5e、6f、7g,取压环1a与取压管8a连接,取压环2b、3c与取压管8b连接,取压环4d、5e与取压管8c连接,取压环6f、7g与取压管8d连接,取压管8a与压力变送器9a连接,取压管8b、8c、8d分别与差压变送器10b、11c、12d连接,压力变送器9a、差压变送器10b、11c、12d均与数据采集卡13电连接,数据采集卡13与计算机14电连接。所述取压环2b、3c的间距为5倍管径D,取压环4d、5e的间距为10倍管径D,取压环6f、7g的间距为15倍管径D。其中取压环1a距离入口300mm,取压环1a与取压环2b相隔200mm,取压环3c与取压环4d相隔200mm,取压环5e与取压环6f相隔200mm。压力变送器9a、差压变送器10b、11c、12d型号为PD-23的输出标准信号与型号为IMP3595的数据采集卡13相连,数据采集卡13与计算机14相连,由计算机14完成压差信号的数据处理,进而实现对油气水多相流流型信号的采集。计算机14还可连接打印机15。基于主成分分析和支持向量机的油气水多相流流型信号采集装置的软件程序是依据自动检测技术及计算机数据处理技术编制的,为本领域技术人员所熟悉的技术。
如图1所示,本发明基于主成分分析和支持向量机的油气水多相流流型识别方法包括下述步骤(1)对不同流型的流动参数信号进行采集在基于主成分分析和支持向量机的油气水多相流流型信号采集装置中,利用取压间距分别为5倍、10倍和15倍管径D;采样频率为256Hz;采样点数为1024点,采样时间为16s;用1个压力变送器9a和3个不同取压间距的差压变送器10b、11c、12d对流动参数信号进行实时采集;(2)应用小波理论对采集的压差波动信号进行去除噪声预处理(a)对1个压力波动和3个不同取压间距的压差波动信号S1、S2、S3和S4按照下面的递归式(1)进行4层小波包分解u2n(t)=2Σkh(k)un(2t-k)u2n-1(t)=2Σkg(k)un(2t-k)---(1)]]>式中h(k)为高通滤波器组;g(k)为低通滤波器组;u0(t)=(t),为尺度函数;u1(t)=ψ(t),为小波函数;k为分解的尺度。h(k)和g(k)满足正交关系g(k)=(-1)kh(1-k) (2)(b)对分解的各个频带分别设定阈值,采用如下的浮动阈值形式
tk=21n(n)σ/n---(3)]]>其中σ为噪声强度,用中位数MAD(υk)/0.6745(υk为小波包分解系数)来估计,n为信号的长度。
(c)用非线性函数ζ=sgn(υk)(|υk|-tk)作用于信号的小波包分解系数υk,得到系数υk,即将浮动阈值以上的系数减去阈值后并保留下来。
(d)由系数υk重建原信号,从而达到去除噪声的目的。
(3)提取流型的特征运用EMD对采集到的压差波动信号x(t)按如下步骤进行分解(a)确定信号x(t)的所有局部极值点,将所有极大值点用三次样条线连接起来形成上包络线,将所有极小值点用三次样条线连接起来形成下包络线,这两条包络线包络了所有的信号数据。
(b)将两条包络线的均值记为μ1,求出y1(t)=x(t)-μ1(4)(c)判断y1(t)是否为IMF,若y1(t)不满足IMF条件,则将y1(t)作为原始数据,此时,记y1(t)=c1(t),则c1(t)为信号x1(t)的第一个IMF分量,它代表信号x1(t)中最高频率的分量;(d)将c1(t)从x1(t)中分离出来,即得到一个去掉高频分量的差值信号r1(t),即有r1(t)=x1(t)-c1(t) (5)将r1(t)作为原始数据,重复步骤(1)、(2)和(3),得到第二个IMF分量c2(t),重复n次,得到n个IMF分量。这样就有r1-c2=r2Mrn-1-cn=rn---(6)]]>当cn(t)或rn(t)满足给定的终止条件(通常使rn(t)成为一个单调函数)时,循环结束,由(2)式和(3)式可得到x(t)=Σi=1nci(t)+rn(t)---(7)]]>式中,rn(t)为残余函数,代表信号的平均趋势。而各IMF分量c1(t),c2(t),Λ,cn(t)分别包含了信号从高到低不同频率段的成分,每一频率段所包含的频率成分都是不同的,且随信号本身的变化而变化。
(e)特征向量的提取。1个压力波动信号和3个压差波动信号的n个IMF分量分别记为c11(t),c12(t),Λ,c1n1(t)、c21(t),c22(t),Λ,c2n2(t)、c31(t),c32(t),Λ,c3n3(t)、c41(t),c42(t),Λ,c4n4(t)。将这些IMF分量组成一个特这个矩阵X,即Xp×n==x11x12Λx1px21x22Λx2pMMMMxn1xn1ΛxnpT=c11Mc1n1c21Mc2n2c31Mc3n3c41Mc4n4T---(8)]]>式中X为p×n的特征矩阵,p为采样点数,n=n1+n2+n3+n4为4个原始信号的所有IMF分量的个数。
(f)对矩阵X用下式变换为相关矩阵,即主成分矩阵R,并计算出相关矩阵R的m个特征值。
①将原始变量进行标准化各指标量纲往往不同,分析时,不同的量纲和数量级会引出新的问题,故要标准化,使标准化的变量平均值为0,方差为1,即
xij*=xij-x‾ivar(xij)]]>i=1,2,Λ,n;j=1,2,Λ,p (9)式中xij*为标准化后的观测量,xi为平均值, 为标准差。
②计算X的相关矩阵R标准化后,相关阵和协方差阵相同,且R的子分量可表示为rij=1nΣi=1nxti*xij*---(10)]]>式中xti*,xij*分别为特征矩阵中第t行第i列与第j列元素。
③求相关矩阵R的特征值及特征向量计算出各特征值(λ1>λ2>Λ>λn)和各特征向量(u1,u2,Λ,un)。
④选择主成分计算各主成分的贡献率及累计贡献率,主成分的个数视具体问题而定,本发明取累计贡献率为90%所对应的m个变量作为主成分。
⑤计算得分在主成分分析中,μj=λj/Σi=1mλi]]>为主成分的贡献率,比值 反映前k个主成分所代表的原始数据信息的百分数。令T=[μ1,μ2,Λ,μm] (11)则T为不同流型的特征向量。
(4)采用支持向量机来实现流型的识别水平管内油气水多相流流型有4种,即分层流、间歇流、泡状流和环状流。根据上述分类情况,采用“一对多”的策略,构造4个二值分类器,分别表示为SVM1、SVM2、SVM3、SVM4。如图2所示。对每一个流型构造一个支持向量机,每个支持向量机的输出yi∈{-1,+1},(i=1,2,3,4),则4个支持向量机的输出是一个4维向量,每一个分量表示样本是否对应该流型,(1,-1,-1,-1)代表分层流,(-1,1,-1,-1)代表间歇流,(-1,-1,1,-1)代表泡状流,(-1,-1,-1,1)代表环状流。用120个(4种流型各30个样本)对支持向量机进行训练,通过比较,确定本发明的核函数为径向基核函数,即K(x,y)=e-||x-y||2/2σ2,]]>式中σ取0.05。训练好的支持向量机可实现对流型的识别。再用200个样本进行测试,结果如表1所示(部分测试样本)。
表1

权利要求
1.一种基于主成分分析和支持向量机的油气水多相流流型识别方法,其特征在于,将主成分分析方法与支持向量机识别技术相结合,自动对油气水多相流管流流型进行识别,其方法包括下述步骤1)对不同流型的流动参数信号进行采集;2)对压力和压差波动信号进行小波包去除噪声预处理;3)对去除噪声后的压力和压差波动信号进行经验模式分解,将分解得到的各个信号的固有模式函数组成一个特征矩阵,再利用主成分分析方法提取流型的特征向量;4)将经验模式分解的能量特征向量作为支持向量机的输入样本,输入与输出的关系由支持向量机来完成,并构造4个二值分类器,由径向基核函数支持向量机完成对流型的识别。
2.根据权利要求1所述的基于主成分分析和支持向量机的油气水多相流流型识别方法,其特征是所述的步骤1是利用取压间距分别为5倍、10倍和15倍管径(D);采样频率为256Hz;采样点数为1024点;1个压力变送器和3个不同取压间距的差压变送器对流动参数信号进行实时采集。
3.根据权利要求1所述的基于主成分分析和支持向量机的油气水多相流流型识别方法,其特征是所述的步骤2的小波包去除噪声预处理,(a)对1个压力波动和3个不同取压间距的压差波动信号S1、S2、S3和S4按照下面的递归式(1)进行4层小波包分解u2n(t)=2Σkh(k)un(2t-k)u2n-1(t)=2Σkg(k)un(2t-k)---(1)]]>式中h(k)为高通滤波器组,g(k)为低通滤波器组,u0(t)=(t)为尺度函数,u1(t)=ψ(t)为小波函数,k为分解的尺度,h(k)和g(k)满足正交关系g(k)=(-1)kh(1-k) (2)(b)对分解的各个频带分别设定阈值,采用如下的浮动阈值形式tk=2ln(n)σ/n---(3)]]>其中σ为噪声强度,用中位数MAD(υk)/0.6745(υk为小波包分解系数)来估计,n为信号的长度;(c)用非线性函数ξ=sgn(υk)(|υk|-tk)作用于信号的小波包分解系数υk,得到系数υk,即将浮动阈值以上的系数减去阈值后并保留下来;(d)由系数υk重建原信号,从而达到去除噪声。
4.根据权利要求1所述的基于主成分分析和支持向量机的油气水多相流流型识别方法,其特征是所述的步骤3流型特征向量的提取,(1)利用经验模式分解技术对1个压力波动信号和3个压差波动信号进行分解,得到n个IMF分量分别记为c11(t),c12(t),Λ,c1n1(t)、c21(t),c22(t),A,c2n2(t)、c31(t),c32(t),Λ,c3n3(t)、c41(t),c42(t),Λ,c4n4(t);将这些IMF分量组成一个特这个矩阵X,即Xp×n=x11x12Λx1px21x22Λx2pMMMMxn1xn1ΛxnpT=c11Mc1n1c21Mc2n2c31Mc3n3c41Mc4n4T]]>式中X为p×n的特征矩阵,p为采样点数,n=n1+n2+n3+n4为4个原始信号的所有IMF分量的个数,xi(i=1,2,Λ,n)为p维向量;(2)将原始变量进行标准化各变量的不同量纲不能直接计算,故要标准化,使标准化的变量平均值为0,方差为1,即xij*=xij-x‾ivar(xij)i=1,2,Λ,n;j=1,2,Λ,p---(7)]]>式中xij*为标准化后的观测量,xi为平均值, 为标准差;(3)计算X的相关矩阵R标准化后,相关阵和协方差阵相同,且R的子分量可表示为rij=1nΣi=1nxti*xij*---(8)]]>式中xti*,xij*分别为特征矩阵中第t行第i列与第j列元素;(4)求相关矩阵R的特征值及特征向量计算出各特征值(λ1>λ2>Λ>λn)和各特征向量(u1,u2,Λ,un);(5)选择主成分计算各主成分的贡献率及累计贡献率,主成分的个数视具体问题而定,本发明取累计贡献率为90%所对应的m个变量作为主成分;(6)计算得分根据主成分表达式计算各主成分得分,在主成分分析中,μj=λj/Σi=1mλi]]>为主成分的贡献率,比值 反映前k个主成分所代表的原始数据信息的百分数,令T=[μ1,μ2,Λ,μm] (9)则T为不同流型的特征向量。
5.根据权利要求1所述的基于主成分分析和支持向量机的油气水多相流流型识别方法,其特征是所述的步骤4是采用支持向量机来实现流型的识别,水平管内油气水多相流流型有4种,即分层流、间歇流、泡状流和环状流,采用“一对多”的策略,构造4个二值分类器,对每一个流型构造一个支持向量机,4个支持向量机的输出是一个4维向量,每一个分量表示样本是否对应该流型,训练好的支持向量机可实现对流型的识别。
全文摘要
一种基于主成分分析和支持向量机的油气水多相流流型识别方法,其特点是利用水平管路、取压环、取压管、压力、差压变送器、数据采集卡和计算机对不同流型的流动参数信号进行采集;将采集到的压力和不同取压间距的压差波动信号进行小波包去除噪声预处理,再对上述信号进行经验模式分解,得到的信号固有模态函数,将这些固有模态函数构成一个特征矩阵X,利用主成分分析得到流型的特征向量;再将这些特征作为支持向量机的输入样本,应用支持向量机完成从特征空间到流型空间的映射,最终实现流型识别。所采用的特征向量融合了多个传感器的信息,能够全面反映流型的信息,所应用的支持向量机同神经网络分类器相比,具有学习速度快、分类能力强等特点。
文档编号G06F19/00GK1904581SQ200610017090
公开日2007年1月31日 申请日期2006年8月1日 优先权日2006年8月1日
发明者孙斌, 周云龙, 赵鹏, 张毅, 关跃波, 洪文鹏 申请人:东北电力大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1