一种变压器局部放电试验典型干扰信号识别系统及方法与流程

文档序号:30221761发布日期:2022-05-31 22:28阅读:91来源:国知局
一种变压器局部放电试验典型干扰信号识别系统及方法与流程

1.本发明涉及变压器局部放电信号识别领域,具体是一种变压器局部放电试验典型干扰信号识别系统及方法。


背景技术:

2.电力变压器既是电力系统中最重要的设备之一,又是电力系统中最昂贵的设备,其因意外停电可能会使对用户的供电中断和造成巨大经济损失。变压器故障主要包括短路损坏故障、过热性故障以及绝缘损坏故障,其中绝缘损坏故障约占总故障的70%~80%。而变压器绝缘故障大多数是由变压器局部放电而引起的绝缘老化或击穿。在国内外变压器绝缘状态诊断领域,局部放电测量是对电气设备局部缺陷最为直接有效的测量手段和评价方法。
3.关于变压器局部放电模式识别的研究有很多,在实验室的样本数据下也有很高的识别率,但是实际应用中经常出现实际测量数据难以分析,主要原因是现有大量局部放电数据分析方法的文献,偏重数学方法理论,缺乏实际经验支撑,应用起来效果不理想,特别是测量的脉冲信号中只含有干扰信号和外部放电信号,具备有与设备内部局部放电类似的特征,完全符合现行标准中典型放电信号特征,对设备状态评价带来困难。因此,识别现场测量的脉冲信号中的干扰信号和外部放电信号并从中提取有效的局部放电有效信号显得尤为重要。


技术实现要素:

4.本发明的目的在于提供一种变压器局部放电试验典型干扰信号识别系统及方法,以提高变压器现场试验局部放电信号识别的抗干扰能力。
5.根据本发明的一方面,提供一种变压器局部放电试验典型干扰信号识别系统,包括:原始特征空间构建模块、特征空间优化模块以及算法识别性能分析模块;
6.所述原始特征空间构建模块,用于通过实验测量建立变压器局部放电和典型干扰信号的数据库,并提取变压器局部放电和典型干扰信号的统计特征、纹理特征和形状特征的特征参数,构建原始特征空间;
7.所述特征空间优化模块,用于采用随机森林算法对原始特征空间构建模块构建的原始特征空间进行优化降维,根据随机森林算法对特征参数的重要性和完备性进行度量并排序,将初始的特征参数进行筛选,并以筛选后的特征参数构造优化特征空间;
8.所述算法识别性能分析模块,用于采用随机森林算法对优化特征空间的局部放电信号和典型干扰信号进行分类识别。
9.进一步的,在计算某个特征参数x的重要性时,首先选择相应的袋外数据来计算每一棵决策树的袋外数据误差,记为er1,er2,...,ern,袋外数据误差指的是将袋外数据做为测试样本数据,此时随机森林的预测错误率称作袋外数据误差;其次随机改变袋外样本数据在特征参数x处的值,再次计算袋外数据误差,分别记为er11,er12,...,er1n;采用p
x

示特征参数x的重要性程度,计算式为:
[0010][0011]
进一步的,所述构建优化特征空间是指在特征重要性度量的基础上,计算每个特征参数的重要性,并按降序排序,然后选择前k个重要性高的特征参数构建优化特征空间,k值的确定方式为:将k从1到特征参数的数量逐次加1,并将优化特征空间构建的数据集做为随机森林分类算法的输入,计算每一个k值对应的分类识别准确率,分类识别准确率趋于稳定时对应的最小k值就做为最终的k值。
[0012]
进一步的,构建原始特征空间时提取脉冲信号的统计特征、纹理特征和形状特征共47个特征参数,分别为7个统计特征和40个图像特征,其中40个图像特征包含15个纹理特征、15个zernike矩和10个hu不变矩构建原始特征空间,构建优化特征空间时最终确定k值为10,取的特征参数是排名前10的特征参数分别为:负半周峭度、逆差矩、zernike矩3、正负半周互相关系数、梯度分布不均匀性、灰度分布不均匀性、小梯度优势、zernike矩8、正半周峰值数、zernike矩1。
[0013]
根据本发明的另一方面,提供一种变压器局部放电试验典型干扰信号识别方法,包括以下步骤:
[0014]
步骤1:通过实验测量建立变压器局部放电和典型干扰信号的数据库,并提取变压器局部放电和典型干扰信号的统计特征、纹理特征和形状特征的特征参数,构建原始特征空间;
[0015]
步骤2:采用随机森林算法对原始特征空间构建模块构建的原始特征空间进行优化降维,根据随机森林算法对特征参数的重要性和完备性进行度量并排序,将初始的特征参数进行筛选,并以筛选后的特征参数构造优化特征空间;
[0016]
步骤3:采用随机森林算法对优化特征空间的局部放电信号和典型干扰信号进行分类识别。
[0017]
进一步的,步骤2中,在计算某个特征参数x的重要性时,首先选择相应的袋外数据来计算每一棵决策树的袋外数据误差,记为er1,er2,...,ern,袋外数据误差指的是将袋外数据做为测试样本数据,此时随机森林的预测错误率称作袋外数据误差;其次随机改变袋外样本数据在特征参数x处的值,再次计算袋外数据误差,分别记为er11,er12,...,er1n;采用p
x
表示特征参数x的重要性程度,计算式为:
[0018][0019]
进一步的,步骤2中,所述构建优化特征空间是指在特征重要性度量的基础上,计算每个特征参数的重要性,并按降序排序,然后选择前k个重要性高的特征参数构建优化特征空间,k值的确定方式为:将k从1到特征参数的数量逐次加1,并将优化特征空间构建的数据集做为随机森林分类算法的输入,计算每一个k值对应的分类识别准确率,分类识别准确率趋于稳定时对应的最小k值就做为最终的k值。
[0020]
进一步的,构建原始特征空间时提取脉冲信号的统计特征、纹理特征和形状特征共47个特征参数,分别为7个统计特征和40个图像特征,其中40个图像特征包含15个纹理特征、15个zernike矩和10个hu不变矩构建原始特征空间,构建优化特征空间时最终确定k值
为10,取的特征参数是排名前10的特征参数分别为:负半周峭度、逆差矩、zernike矩3、正负半周互相关系数、梯度分布不均匀性、灰度分布不均匀性、小梯度优势、zernike矩8、正半周峰值数、zernike矩1。
[0021]
本发明通过基于随机森林算法的特征空间的优化降维方法,解决了原始特征参数过多带来的数据冗余问题,并且比较了不同数据识别方法的识别准确率及稳定性,优选出了基于随机森林算法的干扰信号识别方法,实现变压器局部放电典型干扰信号的识别。
附图说明
[0022]
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0023]
图1为本发明变压器局部放电试验典型干扰信号识别系统其中一个实施例的结构示意图;
[0024]
图2为本发明对特征量重要性度量进行优化选择后的结果示意图。
[0025]
图中:1-原始特征空间构建模块,2-特征空间优化模块,3-算法识别性能分析模块。
具体实施方式
[0026]
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0027]
如图1所示,本发明实施例提供一种变压器局部放电试验典型干扰信号识别系统,包括原始特征空间构建模块1、特征空间优化模块2、以及算法识别性能分析模块3。
[0028]
所述原始特征空间构建模块1与特征空间优化模块2连接,用于建立数据库、提取各类特征参数、构建原始特征空间三部分,具体的,通过实验测量建立变压器局部放电和典型干扰信号的数据库,并提取脉冲信号的统计特征、纹理特征和形状特征共47个特征参数,构建原始特征空间。具体的,本实施例将局部放电信号和典型干扰信号的实验数据建立q-t图谱库,从图谱中提取能够描述两类信号差别的特征参数,提取脉冲信号的统计特征、纹理特征和形状特征等共47个特征参数,分别为7个统计特征和40个图像特征,其中40个图像特征包含15个纹理特征、15个zernike矩和10个hu不变矩构建原始特征空间。
[0029]
所述特征空间优化模块2与原始特征空间构建模块1以及算法识别性能分析模块3均连接,用于采用随机森林算法对原始特征空间构建模块1构建的原始特征空间进行优化降维,根据随机森林算法对特征参数的重要性和完备性进行度量并排序,将初始的47个特征参数筛选为10个特征参数,并以此构造优化特征空间。
[0030]
在计算某个特征参数x的重要性时,首先选择相应的袋外数据(out of bag,oob)来计算每一棵决策树的袋外数据误差,记为er1,er2,...,ern,其中袋外数据指的是通过重复抽样得到新的训练样本数据集来建立决策树时,有大约1/3的数据没有参与决策树的建
立,这部分数据就称为袋外数据。袋外数据误差指的是将袋外数据做为测试样本数据,此时随机森林的预测错误率就被称作袋外数据误差;其次随机改变袋外样本数据在特征参数x处的值,再次计算袋外数据误差,分别记为er11,er12,...,er1n;如果在随机改变特征参数x处的值后,袋外数据误差大幅度增加,则说明这个特征参数x对于样本的预测结果影响很大,进而表明该特征参数x的重要性程度比较高,采用p
x
表示特征参数x的重要性程度,计算式为:
[0031][0032]
构建优化特征空间是指在特征重要性度量的基础上,计算每个特征参数的重要性,并按降序排序;然后选择前k个重要性高的特征参数构建优化特征空间。k值的确定方式为,将k从1到47逐次加1,并将优化特征空间构建的数据集做为随机森林分类算法的输入,计算每一个k值对应的分类识别准确率,分类识别准确率趋于稳定时对应的最小k值就做为最终的k值,也就是优化特征空间含有的元素数。本实施例选取最终的k值为10,取的特征参数是排名前10的特征参数分别为:负半周峭度、逆差矩、zernike矩3、正负半周互相关系数、梯度分布不均匀性、灰度分布不均匀性、小梯度优势、zernike矩8、正半周峰值数、zernike矩1。
[0033]
所述算法识别性能分析模块3与特征空间优化模块2连接,本实施例通过采用三种算法(线性鉴别分析算法、k-最近邻算法和随机森林算法)对局部放电信号和典型干扰信号进行分类识别,比较不同数据识别方法的识别准确率及稳定性,优选出了基于随机森林算法的干扰信号识别方法。
[0034]
其中,线性鉴别分析算法是指,在训练时设法将训练样本数据集投影到一条直线上(在二维中是一条直线,在三维中是一个平面,多维中以此类推),使得同类样本数据集的投影点尽可能地接近、异类样本数据集的投影点尽可能地远离,即类内距离尽可能小,类间距离尽可能大;
[0035]
其中,k-最近邻算法是指,在某个训练样本集合中每行数据包含多个特征参数和分类类别,输入没有标明类别但有多个特征参数的一行测试数据,计算该行测试数据与每一行训练样本数据的距离,选取计算的所有距离中最小的k个,并统计这k个距离对应的训练样本数据的类别,k个训练样本数据中同一类别最多的为测试样本数据的预测分类类别;
[0036]
其中,随机森林算法是指,对特征参数的重要性进行度量,选择重要性较高的特征参数构建优化特征空间。
[0037]
本发明实施例还提供一种变压器局部放电试验典型干扰信号识别方法,包括以下步骤:
[0038]
步骤1:通过实验测量建立变压器局部放电和典型干扰信号的数据库,并提取变压器局部放电和典型干扰信号的统计特征、纹理特征和形状特征的特征参数,构建原始特征空间。
[0039]
具体的,通过实验测量建立变压器局部放电和典型干扰信号的数据库,将局部放电信号和典型干扰信号的实验数据建立q-t图谱库,从图谱中提取能够描述两类信号差别的特征参数,提取脉冲信号的统计特征、纹理特征和形状特征等共47个特征参数,构建原始特征空间。
[0040]
步骤1中,提取了47个特征参数,分别为7个统计特征和40个图像特征,其中40个图像特征包含15个纹理特征、15个zernike矩和10个hu不变矩。
[0041]
步骤2:对构建的原始特征空间进行优化降维,对特征参数的重要性和完备性进行度量并排序,将初始的特征参数进行筛选,并以筛选后的特征参数构造优化特征空间。
[0042]
具体的,采用随机森林算法对特征参数进行重要性度量,择重要性较高的特征参数构建优化特征空间。计算某个特征参数x的重要性时,首先选择相应的袋外数据来计算每一棵决策树的袋外数据误差,其次随机改变袋外样本数据在特征参数x处的值,再次计算袋外数据误差如果在随机改变特征参数x处的值后,袋外数据误差大幅度增加,则说明这个特征参数x对于样本的预测结果影响很大,进而表明该特征参数x的重要程度比较高;然后依据特征参数的重要程度和完备性对原始特征空间进行优化降维,获得优化特征空间。构建优化特征空间是指在特征重要性度量的基础上,计算每个特征参数的重要性,并按降序排序;然后选择前k个重要性高的特征参数构建优化特征空间。k值的确定方式为,将k从1到47逐次加1,并将优化特征空间构建的数据集做为随机森林分类算法的输入,计算每一个k值对应的分类识别准确率。分类识别准确率趋于稳定时对应的最小k值就做为最终的k值,也就是优化特征空间含有的元素数。
[0043]
步骤2中,袋外数据误差指的是将袋外数据做为测试样本数据,此时随机森林的预测错误率就被称作袋外数据误差。
[0044]
本实施例中选取最终的k值为10,取的特征参数是排名前10的特征参数分别为负半周峭度、逆差矩、zernike矩3、正负半周互相关系数、梯度分布不均匀性、灰度分布不均匀性、小梯度优势、zernike矩8、正半周峰值数、zernike矩1。
[0045]
步骤3:采用随机森林算法对优化特征空间的局部放电信号和典型干扰信号进行分类识别。
[0046]
具体的,采用线性鉴别分析算法、k-最近邻算法和随机森林三种典型算法对局部放电信号和典型干扰信号进行分类识别,比较不同数据识别方法的识别准确率及稳定性,优选出了基于随机森林算法的干扰信号识别方法。
[0047]
其中,三种方法的优劣是根据分类识别准确率的高低进行评估,其中识别准确度最高的是随机森林算法,并以此作为最终采用的算法。
[0048]
实例分析
[0049]
所分析的案例为实验室的换流变压器,以实验室测量的换流变压器a相油隙放电、a相尖端放电、a相沿面放电、悬浮放电、接地干扰、人工制造的模仿输电线路周期性放电干扰以及现场噪声干扰在内的7种典型局部放电信号和典型干扰信号共500组数据做为基础,构建统计图谱,并从中提取包含统计、纹理、形状特征在内的47个特征参数,如表1所示。其中统计特征有7个,纹理特征有15个,形状特征共有25个,其中10个是hu不变矩构建的相对矩,15个是zernike矩。最后根据提取的特征参数构建了47
×
500维的原始特征空间。
[0050]
表1原始特征参数列表
[0051]
[0052][0053]
[0054]
采用特征空间优化模块2对特征量重要性度量,并进行优化选择,得到的结果如图2所示。
[0055]
图2中优选出10个特征量(负半周峭度、正半周峰值数、正负半周互相关系数、小梯度优势、灰度分布不均匀性、梯度分布不均匀性、逆差矩、zernike矩1、zernike矩3、zernike矩8),并将优选出的10个特征量组成优化特征空间。
[0056]
根据上面优选出的优化特征空间和实验测量的500个样本数据,构建一个11
×
500维的数据集,其中第1行为每个信号所属的类别,后面10行数据为提取的优化特征参数。从中随机提取11
×
100维做为样本测试集,其余的11
×
400维做为样本训练集,分别运用线性鉴别分析算法、k-最近邻算法和随机森林算法分类识别。重复上述过程10次,并将三种算法的准确识别率列在表2中,但因为样本测试集和样本训练集是随机的,因此10次分类识别过程的样本测试集和样本训练集都是不同的。定义识别准确率p为:
[0057][0058]
表2不同算法准确识别率对比
[0059][0060]
从表2可以得到如下结论:
[0061]
(1)随机森林算法的准确识别率除第三次识别外其余9次全部为最高;
[0062]
(2)这10次识别中线性鉴别分析算法的准确识别率波动在0.83~0.94,k-最近领算法的准确识别率波动在0.83~1.00,随机森林算法的准确识别率波动在0.97~1.00。由此可以得出随机森林算法的准确识别率波动最小。
[0063]
根据表1得出的2个结论,选择随机森林算法做为最终的分类识别算法。
[0064]
本发明通过提取包含统计、纹理、形状特征在内的47个特征参数,并以此为依据构建了原始特征空间,其次采用随机森林算法,对特征参数的重要性进行度量与排序,并根据排序结果将原始特征空间进行优化选择得到优化特征空间,最后采用优化特征空间作为多类线性鉴别分析算法、k-最近邻算法和随机森林算法的输入,将局部放电信号和典型干扰信号做分类识别,通过对三种算法的分类识别准确率进行比较后选择采用随机森林算法。
[0065]
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何属于本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1