油浸式变压器在线监测数据和带电检测数据间系统误差的评价方法与流程

文档序号:12453741阅读:800来源:国知局
油浸式变压器在线监测数据和带电检测数据间系统误差的评价方法与流程

本发明涉及信号分析领域,具体涉及一种油浸式变压器在线监测数据和带电检测数据间系统误差的评价方法。



背景技术:

目前,油浸式变压器设备一般有两种检测手段来监控设备的运转,监控的内容是变压器油内特征气体的含量。一种是在线监测,即使用红外测谱仪远程在线监测设备;一种是带电检测,即专业人员到现场对变压器内部的油进行取样检测。在线监控装置费用低,会产生大量密集的监测数据,但其准确度可能存在一定缺陷;为了安全性考虑,一般电网还会定期派专业人员到现场对设备进行现场检测,从而得到相对于在线监测数据比较稀疏的带电检测数据,并且当在线监测装置显示被检测的变压器出问题时,也会有专业人员去进行现场检测来核实情况,从而得到现场带电检测数据。这样我们就得到了一个密度高的在线监测时间序列,一个密度低的带电检测时间序列,但是对于如何评价这两个不同分布密度的时间序列的走势相似程度,目前没有现成可用的评价方法,因此迫切的需要一个评价标准来衡量两个不同分布密度的时间序列的走势相似程度。

要探究两列数据的走势相似程度,一般情况下有皮尔森相关系数法(Pearson K.Note on Regression and Inheritance in the Case of Two Parents[J].Proceedings of the Royal Society of London,2006,58:240-242.)、最大信息系数法(MIC)(Reshef D N,Reshef Y A,Finucane H K,et al.Detecting novel associations in large data sets.[J].Science,2011,334(6062):1518-24.)和多重分形降趋交叉相关性算法(MF-X-DFA)(Zhou W X.Multifractal detrended cross-correlation analysis for two nonstationary signals.[J].Physical Review E,2008,77(6).)

皮尔森相关系数一般用如下公式计算:

其中r表示两数据列的皮尔森相关系数,n为样本量,Xi,Yi、分别为两个变量的观测值和均值。皮尔森相关系数描述的是两个变量间线性相关强弱的程度。r的取值在-1与+1之间,若r>0,表明两个变量是正相关,即一个变量的值越大,另一个变量的值也会越大;若r<0,表明两个变量是负相关,即一个变量的值越大另一个变量的值反而会越小;r的绝对值越大表明相关性越强。但是皮尔森相关系数有很多缺点,比如皮尔森相关系数只能探究两变量间的线性相关关系,即使r=0,也只能表明两个变量间不是线性相关,但有可能是其他方式的相关。再者,皮尔森相关系数研究的是两个变量间静态的关系,没有时间序列的这一概念。

最大信息系数法(MIC)用如下公式计算:

其主要运用蒙特卡洛抽样的思想,将随机变量的散点图分为一定数量的“格子”,每个格子落入的散点越多,随机变量在该格子上的概率就越大,从而估计出随机变量的联合概率密度。分子表示的就是用随机变量在格子上的概率估计出的联合概率密度来表示互信息。分母中的|X|,|Y|分别表示X,Y方向共被分成了多少段,B为数据总量的0.6或者0.55次方,是个经验值。分母的作用主要是利用这些切割的格子对得到的互信息系数进行标准化,使所得的最大互信息系数范围在(0,1)之间。最大信息系数法不仅可以衡量线性相关性,其他形式的相关性也可以体现,比如没有噪声的正弦函数形式的最大信息系数为1,但是最大信息系数法仍然存在一个缺点,就是同皮尔森相关系数一样没有引入时间序列的概念。

多重分形降趋交叉相关性算法(MF-X-DFA)用如下步骤进行计算:

首先,假定给定两时间序列为x(k),y(k),k=1,2,3...N,构造新的时间序列:

其中分别为样本均值。

然后将X(i),Y(i)分为Ns个不重叠的子序列,每一个子序列具有相同长度s,使得N(s)=int(N/s),得到Xv(i)={X(i),(v-1)s+1≤i≤vs},Yv(i)={Y(i),(v-1)s+1≤i≤vs},v=1,2,3...Ns。再用多项式函数对每个子序列进行最小二乘法拟合(LSM拟合),得到拟合曲线则每一个子序列的降趋协方差表示为:

波动函数定义为:

最后,如果两个时间序列具有长程交叉相关性,则波动函数Fxy(s)和时间间隔s存在幂律关系式hxy的取值范围为(0,1)。若hxy=0.5则表明两时间序列各自不具有长程相关性,即时间序列可以用随机游走来描述,且两者间不存在长程交叉相关性;若0<hxy<0.5,则表明两时间序列各自具有反持久性效应,且两者间具有幂律关系式的反持久性效应的交叉相关性;若0.5<hxy<1,则表明两时间序列各自具有长程相关性,两者间具有幂律关系式的持久性效应的交叉相关性。但是,多重分形降趋交叉相关性算法(MF-X-DFA)只能用于两个相同长度的时间序列。

由此可知,上述现有的方法均不能直接用于油浸式变压器在线监测时间序列与带电时间序列的走势相似程度的分析。



技术实现要素:

本发明提供了一种油浸式变压器在线监测数据和带电检测数据间系统误差的评价方法,经计算得到系统误差ρ,通过该值的大小准确描述了在线监测数据时间序列和带电检测数据时间序列的走势相似程度,该评价方法客观公正,简单易行。

一种油浸式变压器在线监测数据和带电检测数据间系统误差的评价方法,包括如下步骤:

(1)、通过远程在线监测设备获得油浸式变压器油内特征气体的含量,记为在线监测数据;通过人工取样获得油浸式变压器油内特征气体的含量,记为在带电检测数据;分别对在线监测数据和带电检测数据进行预处理,得到时间间隔相同且时间点相互对应的两组特征气体含量-时间序列;

(2)、将预处理后的在线监测特征气体含量-时间序列分为两个集合,既有在线监测数据又有真实带电检测数据的时刻对应的在线监测特征气体含量值组成的集合记为O1,剩余在线监测特征气体含量值组成的集合记为O2

再将预处理后的带电检测特征气体含量-时间序列分为两个集合,既有真实带电检测数据又有在线监测数据的时刻对应的带电检测特征气体含量值组成的集合记为F1,剩余带电检测特征气体含量值组成的集合记为F2

(3)按如下的式(Ⅰ)进行计算,得到系统误差ρ,并通过ρ值的大小来评价油浸式变压器在线监测数据和带电检测数据的走势相似程度;

ρ=αρ1+(1-α)ρ2 (Ⅰ);

式中,ρ1为集合O1与集合F1的系统误差,α为集合O1与集合F1的系统误差权重;ρ2为集合O2与集合F2的系统误差,1-α为集合O2与集合F2的系统误差权重;

0<α<1。

作为优选,步骤(1)中,所述的特征气体包括总烃、乙烯、甲烷、乙烷、乙烯、乙炔、氢气、一氧化碳或二氧化碳;

所述特征气体的含量为特征气体的质量浓度或体积浓度。

作为优选,步骤(1)中,所述的预处理以一天为时间间隔,一天内有多个数据的取平均数,没有数据的用线性插值代替。

步骤(3)中,系统误差权重α的确定采用经验值,因为O1、F1部分有准确带电数据,权重分配大一些,优选0.6≤α≤0.8。

步骤(3)中,ρ1与ρ2的计算公式如下式(Ⅱ)所示:

k=1或2,i、j分别代表在线监测数据或带电检测数据的第i个点和第j个点;

|Ok|表示集合Ok中的元素个数;

ρkij表示ρk的第j个点到第i个点的分量,lkij表示ρkij的权重。

ρkij为ρk的第j个点到第i个点的分量,表示在线数据和带电数据的第j个点到第i个点的系统误差,对于每一部分的系统误差,我们用其序列内每两个对应点的系统误差加权之和来衡量,而每两个对应点的系统误差我们用这两个对应点变化的方向和幅度来衡量,变化方向相同,变化幅度相近的系统误差值大,表示两时间序列走势相似度高;变化方向相反,变化幅度差距大的系统误差值小,表示两时间序列走势相似度低。

当且时,ρk=0,k=1,2。

否则有:

其中:

Oki表示序列Ok中第i项。

对每一个ρkij,我们从其连线的变化方向和变化幅度两个层面来确定其取值,若同向变化,则取正值,变化幅度越相似,ρkij的绝对值越大;反向取负值,变化幅度越越大,ρkij的绝对值越大。当在线数据和带电数据其中有一组连线是平行于横坐标的直线时,因为它没有方向,所以我们用另一组连线的变化幅度来衡量此刻的系统误差。当两连线均平行于横坐标时,表示它们的变化无论方向还是幅度都是一致的,因此定值为1。另外,当带电数据不全为0而在线数据全为0时,我们认为很可能是色谱仪出现了问题,此时我们将其系数定义为0。

对于每两个点的系统误差对整体系统误差的权重分配,我们采用了气体浓度和时间距离两个复合权重,两点的气体浓度越高、时间距离越远权重越大。

lkij的计算公式如下式(Ⅲ):

其中,k=1或2,︱Fk︱表示集合Fk中的元素个数;

Fki表示数量Fk的第i个数据,k=1,2。

Eki表示Fk序列第i个数据对应的时间,k=1,2。

首先,因为我们更关注气体浓度较高时测量的准确性,因此用气体浓度来构建一个ρkij的权重表达式,气体浓度越高,权重越大,记akij为气体浓度权重。

然后,我们关注不同时间距离下两连线对整体走势的描述重要性不同,因此用距离来构建一个ρkij的权重表达式,时间跨度越远权重越大,记bkij为时间距离权重。

然后,综合气体浓度权重和时间距离权重,令:

分子表示用每段点j到点i的气体浓度权重和时间距离权重的积作为新的权重,分母是归一化处理。

至此,所有的ρkij和lkij均计算出来了,代入式(Ⅱ)中,分别得出ρ1与ρ2,再代入式(Ⅰ)中,得出系统误差ρ。

作为优选,对步骤(3)中得到的系统误差ρ进行归一化处理,做如下映射:

将系统误差系数的取值范围在保持原有顺序的基础上由(-1,1]映射为(0,1]。

通过上述评价方法最终获得的系统误差ρ的结果取值范围为(0,1],且上下平移在线数据不会改变算法结果,值越大越好。结果的值越大代表在线监测数据和带电检测数据的走势越相近;越小表示在线监测数据和带电检测数据的走势越不相同。

其中,算法取到边界点的条件为:当结果为1时,即带电检测数据的线性插值和在线监测数据的曲线完全平行。当结果为0时,即带电检测数据的线性插值和在线监测数据的曲线关于平行于横坐标的直线y=a对称时,且带电检测数据任意两点的斜率为正负无穷,a是任意时刻两曲线上点的均值。也就是说0值只能趋近不能到达。

与现有技术相比,本发明具有以下优点:

本发明中的评价方法引入了时间序列的概念,通过一系列计算后可以得到系统误差ρ,该值可以准确描述在线监测数据时间序列和带电检测数据时间序列的走势相似程度,该评价方法客观公正,简单易行。

附图说明

图1为某变压器油内乙烯浓度的在线监测数据与带电检测数据对比图;

图2为某变压器油内二氧化碳气体浓度的在线监测数据与带电检测数据对比图;

图3为某变压器油内一氧化碳浓度的在线监测数据与带电检测数据对比图;

图4为某变压器油内一氧化碳浓度的在线监测数据与带电检测数据对比图;

图5为某变压器油内一氧化碳浓度的在线监测数据与带电检测数据对比图;

以上数据均来自不同变压器。

具体实施方式

下面结合具体实施例对本发明做进一步的说明,但本发明不限于下述实施例。

实施例1监控油浸式变压器油内乙烯气体的浓度,数据如图1所示:

对两个时间序列进行预处理,在线监测时间序列以一天为时间间隔,一天内有多个数据的取平均数,没有数据的用线性插值代替;带电检测时间序列也以一天为时间间隔,一天内有多个数据的取平均数,没有数据的用线性插值代替。

然后将数据分为两个部分来研究,一部分是在线时间序列对应时间点有带电数据的部分组成的集合,记作O1,对应的带电时间序列部分为F1,另一部分是在线时间序列对应时间点没有带电数据的部分组成的集合,记作O2,对应的带电时间序列部分为F2。记O1、F1部分对整体系统误差的影响权重为α,O2、F2部分对整体系统误差的影响权重为1-α,ρ1和ρ2分别表示O1、F1和O2、F2两部分的系统误差,则整体的系统误差为ρ=αρ1+(1-α)ρ2。记ρkij是ρk的第j个点到第i个点的分量,表示在线数据和带电数据的第j个点到第i个点的系统误差,记lkij为ρkij综合的权重,因此有:

|Ok|表示集合Ok中的元素个数,k=1,2。

当且时,ρk=0,k=1,2。

否则有:

其中:

Oki表示序列Ok中第i项。

对每一个ρkij,我们从其连线的变化方向和变化幅度两个层面来确定其取值,若同向变化,则取正值,变化幅度越相似ρkij的绝对值越大;反向取负值,变化幅度越越大ρkij的绝对值越大。当在线数据和带电数据其中有一组连线是平行于横坐标的直线时,因为他没有方向,所以我们用另一组连线的变化幅度来衡量此刻的系统误差。当两连线均平行于横坐标时,表示他们的变化无论方向还是幅度都是一致的,因此定值为1。另外,当带电数据不全为0而在线数据全为0时,我们认为很可能是色谱仪出现了问题,此时我们将其系数定义为0。

最后再来确定每个连线的权重lkij

首先,因为我们更关注气体浓度较高时测量的准确性,因此用气体浓度来构建一个ρkij的权重表达式,气体浓度越高,权重越大,记akij为ρkij的权重。

然后,我们关注不同时间距离下两连线对整体走势的描述重要性不同,因此用距离来构建一个ρkij的权重表达式,时间跨度越远权重越大,记bkij为ρkij的权重。

然后,综合气体浓度权重和时间距离权重,令:

分子表示用每段点j到点i的气体浓度权重和时间距离权重的积作为新的权重,分母是归一化处理。

至此,所有的ρkij和lkij均计算出来了,因为O1、F1部分有准确带电数据,权重分配大一些,令α=0.6,则系统误差为:

最后,做归一化处理,做如下映射:

将系统误差系数的取值范围在保持原有顺序的基础上由(-1,1]映射为(0,1]。最终得到的系统误差为0.7881。

图1为某变压器油内乙烯浓度的在线监测数据与带电检测数据对比图,观察可知,两组数据的时间序列只有开始一小段方向相反,中间一小段幅度不一致,其它地方两时间序列的走势很相近,两组时间序列的走势相似程度与计算得到的系统误差的数值相符。

实施例2监控油浸式变压器油内二氧化碳气体的浓度,数据如图2所示:

采用与实施例1中相同的计算方式,计算得到的系统误差为0.6573。

观察图2可知,两组数据的时间序列的总体走势表现一般,中间部分出现一个较大的偏差,紧接着又有一个反向阶段,尾部的方向也相反,两组时间序列的走势相似程度与计算得到的系统误差的数值相符。

实施例3监控油浸式变压器油内一氧化碳气体的浓度,数据如图3所示:

采用与实施例1中相同的计算方式,计算得到的系统误差为0.3478。

观察图3可知,两组数据的时间序列的总体走势表现很差,带电时间序列几乎没有波动,而在线时间序列有很多个大幅波动,两组时间序列的走势相似程度与计算得到的系统误差的数值相符。

由以上三个实施例可以看出,系统误差的评价标准是客观公正的,可以很好地描述在线监测数据和带电检测数据两时间序列走势的相似程度。

实施例4监控油浸式变压器油内一氧化碳气体的浓度,数据如图4所示:

采用与实施例1中相同的计算方式,计算得到的系统误差为0.3119。

对比例1~2监控油浸式变压器油内一氧化碳气体的浓度,数据如图4所示:

分别通过皮尔森相关系数法和最大信息系数法对图4中的数据进行计算,得到的皮尔森相关系数为-0.4135,最大信息系数为0.9179。

观察图4可知,两组数据的时间序列随时间的推移近似是相反的走势,显然最大信息系数为0.9179不能准确体现在线测试一氧化碳数据和带电测试一氧化碳插值数据两个时间序列的走势关系。而采用本发明中的方法获得的系统误差为0.3119和皮尔森相关系数为-0.4135较好地描述了两时间序列的走势相似度情况。

实施例5监控油浸式变压器油内一氧化碳气体的浓度,数据如图5所示:

采用与实施例1中相同的计算方式,计算得到的系统误差为0.7426。

对比例3~4监控油浸式变压器油内一氧化碳气体的浓度,数据如图5所示:

分别通过皮尔森相关系数法和最大信息系数法对图5中的数据进行计算,得到的皮尔森相关系数为1,最大信息系数为1。

观察图5可知,两组数据的时间序列的走势随时间变化方向基本一致,但变化的幅度有所不同,显然最大信息系数和皮尔森相关系数为1均不能准确体现在线测试一氧化碳数据和带电测试一氧化碳插值数据两个时间序列的走势关系,而系统误差系数0.7426较好地描述了两时间序列的走势情况。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1