一种基于Hilbert变换的GIS局部放电信号特征提取方法与流程

文档序号:30389807发布日期:2022-06-11 13:53阅读:166来源:国知局
一种基于Hilbert变换的GIS局部放电信号特征提取方法与流程
一种基于hilbert变换的gis局部放电信号特征提取方法
技术领域
1.本发明gis局部放电在线监测技术领域,具体涉及一种基于hilbert变换的gis局部放电信号特征提取方法。


背景技术:

2.随着我国国民经济的快速发展,电力工业建设的突飞猛进,大电网、大容量、超高压、大机组己经成为现代电力系统的特点和发展趋势,为保障电力系统的安全性、稳定性和可靠性,对电力设备运行提出了更高的要求。由于气体绝缘组合电器(gas insulated switchgear,简称gis)具有占地面积小、运行安全可靠、维护工作量少、检修周期长等一系列优点,近些年来在现代电力系统中得到了广泛的应用。
3.gis在制造、运输、安装和运行的过程中容易出现金属毛刺、电极电位浮动、自由金属颗粒和绝缘老化等各种缺陷,这些缺陷将导致不同程度的局部放电,长期的局部放电将使设备绝缘进一步劣化,严重时将造成整个绝缘击穿,从而对设备的安全运行造成严重的威胁。因此,有必要对gis内产生的局部放电进行检测识别,判断引发局部放电的绝缘缺陷类型,及时针对不同的缺陷类型进行相应的检修维护工作,防止出现绝缘整体击穿的重大事故。其中局部放电信号特征的提取是局部放电信号检测识别的关键。
4.当前国内外学者对局部放电信号特征的提取开展了大量研究,主要形成了以下四类特征提取方法:(1)统计特征提取法;(2)分形特征提取法;(3)小波特征提取法;(4)图像矩特征提取法,这四类特征提取方法主要存在以下问题:
5.统计特征提取法所需的样本数量较大,得到的特征量维数较高,会产生一定的信息冗余,不利于后续的模式识别;分形特征提取法的分形维数计算容易受到局部放电信号长度和有效信号点数的影响,并且提取的特征量维数较高;小波特征提取法在计算特征量时很难选择合适的小波基和分解层数;图像矩特征法计算复杂度较高,且没有明确的物理意义,在实际应用中受到一定限制。
6.因此目前急需一种能简单、有效提取gis局部放电信号特征的方法,以便对gis内产生的局部放电信号进行快速、有效地识别。
7.经过检索,申请公开号为cn110231548a,一种基于超声信号包络谱的gis局部放电特征提取方法,该方法可以帮助识别不同类型的局部放电绝缘缺陷。包括:设计三种gis典型绝缘缺陷,采集局部放电超声信号;利用fir带通滤波器对局放超声信号进行滤波处理;利用hilbert变换对滤波后的局放超声信号进行包络提取;对信号包络进行工频相关性及相位模式分析,得到不同缺陷类型的测量特征,
8.上述发明基于超声信号包络谱只提取了局部放电信号的峰峰值、峰值、有效值、偏斜度和峭度等波形统计特征参数,却忽略了方差、波形因子、峰值因子、脉冲因子和裕度因子等包含局部放电信号重要波形特征信息的特征参数;上述发明基于超声信号包络谱只提取了局部放电信号的50hz频率相关性和100hz频率相关性等频域特征参数,却忽略了频率幅值均值、重心频率、均方根频率、频率方差和第一主频频率等包含局部放电信号重要频域
特征信息的特征参数。因此上述发明提取的局部放电特征没有包含局部放电信号的大部分信息,并不能很好地表征局部放电信号,会影响后续局部放电模式识别的精度。
9.本发明分别基于信号的时域波形包络和频谱包络来提取时域特征参数和频域特征参数,并联合由局部放电有效数据提取得到的统计特征参数共同构建放电特征数据,由上述三类特征参数构建的局部放电特征数据总共包含了24组信号特征指标,基本包含了局部放电信号的全部特征信息,解决了前述发明存在的局部放电特征包含的信息量不足等问题。同时本发明还创新性地提出了改进的kpca算法,并利用改进的kpca算法对提取的局部放电特征数据进行降维处理,得到了维数较低且能正确执行局部放电分类的特征量,其较低的特征维数也使得后续识别模型的训练和识别时间大大缩减,提高了局部放电模式识别效率
10.因此相比前述发明,本发明提取的局部放电特征参数包含更多的有效放电信息,且特征维数较低,分类效果更好,更有利于后续的局部放电模式识别。


技术实现要素:

11.本发明旨在解决以上现有技术的问题。提出了一种能简单、有效地基于hilbert变换的gis局部放电信号特征提取方法。本发明的技术方案如下:
12.一种基于hilbert变换的gis局部放电信号特征提取方法,其包括以下步骤:
13.采集现场检测的气体绝缘组合电器gis局部放电信号;
14.对采集的gis局部放电信号进行有效数据的提取,去除不包含放电信息的无效信号数据;
15.利用hilbert变换求取放电信号的包络;
16.基于放电信号的包络提取局部放电脉冲波形的统计特征参数、时域特征参数和频域特征参数,利用这三类特征参数构建局部放电特征数据;
17.利用改进的核主成分分析法对提取的局部放电特征数据进行降维处理,核主成分分析kpca是通过一个非线性映射将原始输入空间的特征数据投影到高维特征空间,然后在高维特征空间中利用主成分分析pca对数据进行降维,最终得到维数较低的且能正确执行局部放电分类的特征数据。
18.进一步的,所述采集现场检测的气体绝缘组合电器gis局部放电信号是利用keysight品牌的dsox6002a型号示波器进行采集,其带宽为和采样率最高分别可达4ghz和20.0gsa/s,可以实现对gis局部放电信号的有效采集。
19.进一步的,所述对局部放电信号进行有效数据的提取,具体包括:只截取局部放电信号中间的一段放电脉冲数据进行特征参数的提取,将放电脉冲出现前和放电脉冲衰减完后的数据进行去除。
20.进一步的,所述利用hilbert变换求取放电信号的包络,具体包括:
21.首先对局部放电信号时域波形的电压值取绝对值,得到局部放电信号的单极性波形,然后利用hilbert变换求取该单极性波形的包络,得到局部放电信号的时域波形包络;在完成时域波形包络的提取后,对放电信号波形进行快速傅里叶变换,将信号的波形由时域变换到频域中,然后利用hilbert变换求取放电信号的频谱包络。
22.进一步的,所述hilbert变换是数学和信号处理的一种同域变换,提供了实现给定
函数或傅里叶序列的调和共轭的具体方法,对于连续时域信号x(t),定义其hilbert变换为:
[0023][0024]
其中t是时间自变量,是用于作卷积运算的时间变换量。x(t)的解析信号a(t)定义为
[0025][0026]
其中j是复数的虚部单位。解析信号的模值e(t)即为x(t)的包络
[0027][0028]
而对于长度为m的离散信号序列x(n)及其fft序列x(k),有
[0029][0030]
其中a(k)为x(n)的离散解析信号a(n)对应的fft序列,则x(n)的包络e(n)为
[0031]
e(n)=|a(n)|=|ifft[a(k)]|
ꢀꢀꢀꢀꢀꢀ
(5)
[0032]
ifft表示快速傅里叶逆变换。
[0033]
进一步的,所述基于信号的包络提取局部放电脉冲波形的统计特征参数、时域特征参数和频域特征参数,具体包括:
[0034]
分别基于信号的时域波形包络和频谱包络来提取时域特征参数和频域特征参数,并联合由局部放电有效数据提取得到的统计特征参数共同构建放电特征数据;其中时域特征参数主要包括上升时间、下降时间、峰值时间和脉冲宽度,频域特征参数主要包括频率幅值均值、重心频率、均方根频率、频率方差、第一主频频率和第一主频峰值,统计特征参数主要包括均值、最大值、最小值、峰峰值、绝对均值、方根幅值、均方根值、方差、偏斜度、峭度、波形因子、峰值因子、脉冲因子和裕度因子;因此由上述三类特征参数构建的局部放电特征数据包含了24组信号特征指标,其特征维数为24维,几乎包含了局部放电信号的全部特征信息。
[0035]
进一步的,构建局部放电特征数据的部分特征参数定义如下:
[0036]
偏斜度:偏斜度α主要反映了信号的不对称情况,当偏斜度值越大,不对称性越严重,xi是信号第i个数据点的幅值,n为数据点的数目;
[0037][0038]
峭度:峭度β主要反映了信号的陡峭程度,对信号中的脉冲比较敏感;
[0039][0040]
波形因子:波形因子sf是信号的均方根值与绝对均值的比值,其敏感性不好,但是稳定性较好;
[0041][0042]
峰值因子:峰值因子cf是信号的最大值与均方根值的比值,反映了峰值在波形中的极端程度,x
max
为信号的幅值最大值;
[0043][0044]
裕度因子:裕度因子clf是信号的最大值与方根幅值的比值;
[0045][0046]
脉冲因子:脉冲因子if是信号的最大值与绝对均值的比值;
[0047][0048]
上升时间:上升时间tr为脉冲从峰值的10%处上升到峰值的90%处所需的时间,t
r_90%
和t
r_10%
分别为脉冲上升沿中峰值的90%和10%处所对应的时刻;
[0049]
tr=t
r_90%-t
r_10%
ꢀꢀꢀꢀꢀꢀꢀ
(12)
[0050]
下降时间:下降时间td为脉冲从峰值的90%处下降到峰值的10%处所需的时间,t
d_90%
和t
d_10%
分别为脉冲下降沿中峰值的90%处和10%处所对应的时刻;
[0051]
td=t
d_10%-t
d_90%
ꢀꢀꢀꢀꢀꢀ
(13)
[0052]
峰值时间:峰值时间t
p
为脉冲从起始处上升到峰值处所需的时间,t
peak
和t0分别为脉冲峰值处和起始处所对应的时刻;
[0053]
t
p
=t
peak-t0ꢀꢀꢀꢀꢀꢀꢀ
(14)
[0054]
脉冲宽度:脉冲宽度tw为脉冲从上升沿中峰值的50%处到下降沿中峰值的50%处所需的时间,t
r_50%
和t
d_50%
分别为脉冲上升沿中峰值的50%处和下降沿中峰值的50%处所对应的时刻;
[0055]
tw=t
d_50%-t
r_50%
ꢀꢀꢀꢀꢀꢀꢀ
(15)
[0056]
重心频率:重心频率fc能够描述信号在频谱中分量较大的信号成分的频率,反映
信号功率谱的分布情况,fi是时域信号经快速傅里叶变换后产生的频谱中第i个信号成分的频率,ai为第i个信号成分对应的幅值,k为频谱中信号成分的数目;
[0057][0058]
频率方差:频率方差vf描述信号功率谱能量分布的分散程度;
[0059][0060]
第一主频频率:第一主频频率fi为频谱中幅值最大的信号成分对应的频率。
[0061]
第一主频峰值:第一主频峰值为频谱中所有信号成分的最大的幅值。
[0062]
进一步的,所述利用改进的kpca算法对提取的局部放电特征数据进行降维处理,最终得到维数较低的且能正确执行局部放电分类的特征数据,具体包括:
[0063]
一般的kpca算法步骤如下:
[0064]
对于输入空间中的m组特征数据xk(k=1,2,...,m),xk∈rn,xk是第k组特征数据,rn是维数为n的输入空间,对该输入空间的特征数据进行中心化,使则其协方差矩阵c为
[0065][0066]
对于一般pca方法,即通过求解特征方程
[0067]
λv=cv
ꢀꢀꢀꢀꢀꢀꢀꢀ
(19)
[0068]
获得方差贡献率大的特征值(对应较大的特征值)及与之对应的特征向量。现引入非线性映射函数φ,使输入空间中的特征数据x1,x2,...,xm变换为高维特征空间中的特征数据φ(x1),φ(x2),...,φ(xm),并假设
[0069][0070]
则在高维特征空间中的协方差矩阵为
[0071][0072]
因此,高维特征空间中的pca是求解方程
[0073][0074]
中的特征值λ和特征向量ν,进而有
[0075][0076]
注意到上式中特征向量ν可以由φ(xk)(k=1,2,...,m)线性表示出,即
[0077][0078]
其中αi为φ(xi)的系数,由式(22)~式(24)得
[0079][0080]
定义m
×
m矩阵k:
[0081]kij
≡φ(xi)
·
φ(xj)
ꢀꢀꢀꢀꢀꢀꢀ
(26)
[0082]
式(25)简化为
[0083]
mλkα=k2α
ꢀꢀꢀꢀꢀꢀꢀ
(27)
[0084]
其中α是m
×
1的向量,第j个元素为αj,显然满足
[0085]
mλα=kα
ꢀꢀꢀꢀꢀꢀꢀ
(28)
[0086]
则必然满足式(27),通过对式(28)的求解,以及联合式(24)即可获得方差贡献率大的特征值及与之对应的特征向量;
[0087]
若假设式(20)不成立,则此时式(28)中的k用代替;
[0088][0089]
式中1
ij
=1(对于所有的i,j);
[0090]
通过分别计算高维特征空间中的特征数据φ(x1),φ(x2),...,φ(xm)在前n个最大的特征值λ1,λ2,...,λn所对应的特征向量ν1,ν2,

,νn上的投影值,即可得到降维后维数为n的特征数据。
[0091]
上述一般的kpca算法通过使用方差贡献率来选择特征向量,从而完成对高维特征空间中的特征数据的降维,具有较好的数据降维效果,但是在整个降维过程中只考虑最大化地保留样本的总特征信息量(特征值代表了对应特征向量方向上包含的信息量)而没有考虑样本的类别信息,即只从数学角度考虑矩阵主要成分而没有考虑实际样本的分类问题,这会导致降维后的特征量对于异常数据的分类并没有很好的效果。
[0092]
而对于分类问题来说,特征提取的目的就是要提取出有利于后续分类的特征组合,为此本发明提出了一种改进的kpca算法,通过各特征向量的类内聚集程度和类间离散程度来度量类别信息,不仅保留了较好的降维效果,而且使得降维后的特征数据更有利于后续的模式分类。每个特征向量的类内聚集程度描述为:
[0093][0094]
式中:为第i类数据的第k个特征向量的方差,c为类别数,每个特征向量的类间离散程度为:
[0095]
[0096]
式中:li表示第i类样本数目,表示第i类的第n个样本的第k个特征向量值,那么由式(30)、(31)得出类别的信息度量jk为:
[0097][0098]
根据公式(32)可知,jk越小就说明类别信息量越大,那么就越容易进行分类,即这个特征向量方向上包含的类别信息量越大。但并不是类别信息量越大就越能提高分类准确率,有些特征向量方向上包含的类别信息量大,但不一定会对分类效果起到积极的作用。因此,本发明使用相似度来衡量提取的各特征向量与样本的类别向量之间的相关性,通过特征向量与样本类别向量间的相关系数来选取特征向量的组合,去除对分类效果不明显的特征向量,其公式为:
[0099][0100]
式中:ξ为特征向量与样本类别属性向量的相关系数;vi为特征向量(其中i=1,2,3,

,n);vz是原样本中的类别属性向量。若ξ的绝对值大于零或等于1,则说明两特征向量是相关的;若ξ相似趋于或等于0,则说明两向量是不相关的。通过计算特征向量与样本的类别向量间的相关系数ξ,排除不相关或相关系数非常小的特征向量,去掉后会减小后续分类器的计算量,从而减小了分类的训练和识别时间。
[0101]
改进的kpca的具体降维步骤总结如下:
[0102]
假设输入空间中有m组特征数据,每组特征数据有n个特征属性(不包含类别特征),根据改进的kpca原理,特征提取的具体实现过程为:
[0103]
(1)列出一个(m
×
n)维数据矩阵,其中m为样本个数,n为每个样本的属性个数;
[0104]
(2)通过一般的kpca算法求解式(28)并联合式(24),求得高维特征空间中的协方差矩阵的特征值及对应的特征向量;
[0105]
(3)求取各特征向量的信息度量jk,按照信息度量jk从小到大的顺序,对相应的特征向量进行排序;
[0106]
(4)提取前m个特征向量ν1,ν2,

,νm,从第一个特征向量ν1开始,依次根据式(33)计算ν1,ν2,...,νm与原样本中的类别属性向量vz的相关系数ξ;
[0107]
(5)从步骤(4)中找到与类别向量vz的相关系数ξ为0或趋于0的特征向量,将其从特征向量组中去除,得到剩余的n个特征向量;
[0108]
(6)对剩余特征向量按照相关系数从大到小的顺序重新排列;
[0109]
(7)通过分别计算高维特征空间中的特征数据在剩余的特征向量上的投影值,即可得到降维后维数为n的且分类效果较好的特征数据。
[0110]
本发明的优点及有益效果如下:
[0111]
本发明的创新主要是提出了一种能简单、有效地提取gis局部放电信号特征的方法。通常的局部放电特征提取方法(例如小波特征提取法、图像矩特征提取法等)存在计算复杂度高、计算参数设置困难和物理意义不明确等问题,而本发明采用基于hilbert变换的特征提取方法,通过局部放电信号包络来提取放电特征量,不仅计算复杂度低,而且提取的
特征量物理意义明确,基本包含了局部放电的全部特征信息,能准确地表征局部放电信号;通常的局部放电特征提取方法存在提取的特征量维数较高且分类效果不理想等问题,而本发明利用改进的kpca算法对提取的局部放电特征数据进行降维处理,得到了维数较低且能正确执行局部放电分类的特征量,其较低的特征维数也使得后续识别模型的训练和识别时间大大缩减,提高了局部放电模式识别效率;相比一般的kpca算法通过使用方差贡献率来选择特征向量,改进的kpca算法通过求取各特征向量的信息度量以及各特征向量与原样本中类别属性向量的相关系数来选择特征向量,不仅保留了一般kpca算法的良好降维效果,而且其降维后的特征数据分类效果更好。
[0112]
相比前述发明(申请公开号为cn110231548a,一种基于超声信号包络谱的gis局部放电特征提取方法),本发明提取的特征参数更多,分别提取了统计特征参数、时域特征参数和频域特征参数等共计24组特征参数来构建局部放电特征数据,基本包含了局部放电信号的全部特征信息,解决了前述发明存在的局部放电特征包含的信息量不足等问题。同时本发明还创新性地提出了改进的kpca算法,并利用改进的kpca算法对提取的局部放电特征数据进行降维处理,得到了维数较低且能正确执行局部放电分类的特征量,其较低的特征维数也使得后续识别模型的训练和识别时间大大缩减,提高了局部放电模式识别效率。
[0113]
因此相比前述发明,本发明提取的局部放电特征参数包含更多的有效放电信息,且特征维数较低,分类效果更好,更有利于后续的局部放电模式识别。
附图说明
[0114]
图1是本发明提供优选实施例的步骤流程示意图;
[0115]
图2是现场测得的原始gis局部放电信号波形图;
[0116]
图3是去除无效信号数据后的gis局部放电信号波形图;
[0117]
图4是提取的放电信号时域波形包络;
[0118]
图5是提取的放电信号频谱包络。
具体实施方式
[0119]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、详细地描述。所描述的实施例仅仅是本发明的一部分实施例。
[0120]
本发明解决上述技术问题的技术方案是:
[0121]
如图1所示,一种基于hilbert变换的gis局部放电信号特征提取方法,其包括以下步骤:
[0122]
1)利用局部放电信号采集单元采集现场检测的gis局部放电信号。
[0123]
2)对采集的gis局部放电信号进行有效数据的提取,去除不包含放电信息的无效信号数据。
[0124]
3)利用hilbert变换求取放电信号的包络。
[0125]
4)基于信号的包络提取局部放电脉冲波形的统计特征参数、时域特征参数和频域特征参数,利用这三类特征参数构建局部放电特征数据。
[0126]
5)利用改进的核主成分分析法对提取的局部放电特征数据进行降维处理,最终得到维数较低的且能正确执行局部放电分类的特征数据。
[0127]
进一步的,所述步骤2)对局部放电信号进行有效数据的提取,由于gis局部放电脉冲出现前和衰减完后的数千个采样数据点基本不包含有效的放电信息,因此只截取信号中间的一段放电脉冲数据进行特征参数的提取,将放电脉冲出现前和衰减完后的数据进行去除。
[0128]
进一步的,所述步骤3)中首先对局部放电信号时域波形的电压值取绝对值,得到局部放电信号的单极性波形,然后利用hilbert变换求取该单极性波形的包络,得到局部放电信号的时域波形包络;在完成时域波形包络的提取后,对放电信号波形进行快速傅里叶变换,将信号的波形由时域变换到频域中,然后利用hilbert变换求取放电信号的频谱包络;hilbert变换是数学和信号处理的一种同域变换,提供了实现给定函数或傅里叶序列的调和共轭的具体方法,对于连续时域信号x(t),定义其hilbert变换为:
[0129][0130]
其中t是时间自变量,τ是用于作卷积运算的时间变换量。
[0131]
x(t)的解析信号a(t)定义为
[0132][0133]
其中j是复数的虚部单位。
[0134]
解析信号的模值e(t)即为x(t)的包络
[0135][0136]
而对于长度为m的离散信号序列x(n)及其fft序列x(k),有
[0137][0138]
其中a(k)为x(n)的离散解析信号a(n)对应的fft序列。则x(n)的包络e(n)为
[0139]
e(n)=|a(n)|=|ifft[a(k)]|
ꢀꢀꢀꢀꢀꢀ
(5)
[0140]
ifft表示快速傅里叶逆变换。
[0141]
进一步的,所述步骤4)中分别基于信号的时域波形包络和频谱包络来提取时域特征参数和频域特征参数,并联合统计特征参数(由局部放电有效数据提取得到)共同构建放电特征数据;其中时域特征参数主要包括上升时间、下降时间、峰值时间和脉冲宽度,频域特征参数主要包括频率幅值均值、重心频率、均方根频率、频率方差、第一主频频率和第一主频峰值,统计特征参数主要包括均值、最大值、最小值、峰峰值、绝对均值、方根幅值、均方根值、方差、偏斜度、峭度、波形因子、峰值因子、脉冲因子和裕度因子;因此由上述三类特征参数构建的局部放电特征数据包含了24组信号特征指标,其特征维数为24维,几乎包含了局部放电信号的全部特征信息;部分特征参数的定义如下:
[0142]
偏斜度:偏斜度α主要反映了信号的不对称情况,当偏斜度值越大,不对称性越严
重(xi是信号第i个数据点的幅值,n为数据点的数目)。
[0143][0144]
峭度:峭度β主要反映了信号的陡峭程度,对信号中的脉冲比较敏感。
[0145][0146]
波形因子:波形因子sf是信号的均方根值与绝对均值的比值,其敏感性不好,但是稳定性较好。
[0147][0148]
峰值因子:峰值因子cf是信号的最大值与均方根值的比值,反映了峰值在波形中的极端程度(x
max
为信号的幅值最大值)。
[0149][0150]
裕度因子:裕度因子clf是信号的最大值与方根幅值的比值,其敏感性很好,但稳定性一般。
[0151][0152]
脉冲因子:脉冲因子if是信号的最大值与绝对均值的比值,其拥有较好的敏感性,但是稳定性一般
[0153][0154]
上升时间:上升时间tr为脉冲从峰值的10%处上升到峰值的90%处所需的时间,t
r_90%
和t
r_10%
分别为脉冲上升沿中峰值的90%和10%处所对应的时刻。
[0155]
tr=t
r_90%-t
r_10%
ꢀꢀꢀꢀꢀꢀꢀ
(12)
[0156]
下降时间:下降时间td为脉冲从峰值的90%处下降到峰值的10%处所需的时间,t
d_90%
和t
d_10%
分别为脉冲下降沿中峰值的90%处和10%处所对应的时刻。
[0157]
td=t
d_10%-t
d_90%
ꢀꢀꢀꢀꢀꢀ
(13)
[0158]
峰值时间:峰值时间t
p
为脉冲从起始处上升到峰值处所需的时间,t
peak
和t0分别为脉冲峰值处和起始处所对应的时刻。
[0159]
t
p
=t
peak-t0ꢀꢀꢀꢀꢀꢀꢀ
(14)
[0160]
脉冲宽度:脉冲宽度tw为脉冲从上升沿中峰值的50%处到下降沿中峰值的50%处所需的时间,t
r_50%
和t
d_50%
分别为脉冲上升沿中峰值的50%处和下降沿中峰值的50%处所对应的时刻。
[0161]
tw=t
d_50%-t
r_50%
ꢀꢀꢀꢀꢀꢀꢀ
(15)
[0162]
重心频率:重心频率fc能够描述信号在频谱中分量较大的信号成分的频率,反映信号功率谱的分布情况(fi是时域信号经快速傅里叶变换后产生的频谱中第i个信号成分的频率,ai为第i个信号成分对应的幅值,k为频谱中信号成分的数目)。
[0163][0164]
频率方差:频率方差vf描述信号功率谱能量分布的分散程度。
[0165][0166]
第一主频频率:第一主频频率fi为频谱中幅值最大的信号成分对应的频率。
[0167]
第一主频峰值:第一主频峰值为频谱中所有信号成分的最大的幅值
[0168]
进一步的,所述步骤5)中利用改进的kpca算法对提取的局部放电特征数据进行降维处理,最终得到维数较低的且能正确执行局部放电分类的特征数据;改进的kpca算法降维的主要原理如下:核主成分分析(kpca)是一种非线性数据处理方法,其核心思想是通过一个非线性映射将原始输入空间的特征数据投影到高维特征空间,然后在高维特征空间中利用主成分分析(pca)对数据进行降维。
[0169]
一般的kpca算法步骤如下:
[0170]
对于输入空间中的m组特征数据xk(k=1,2,...,m),xk∈rn(xk是第k组特征数据,rn是维数为n的输入空间),对该输入空间的特征数据进行中心化,使则其协方差矩阵c为
[0171][0172]
对于一般pca方法,即通过求解特征方程
[0173]
λv=cv
ꢀꢀꢀꢀꢀꢀꢀꢀ
(19)
[0174]
获得方差贡献率大的特征值(对应较大的特征值)及与之对应的特征向量。现引入非线性映射函数φ,使输入空间中的特征数据x1,x2,...,xm变换为高维特征空间中的特征数据φ(x1),φ(x2),...,φ(xm),并假设
[0175]
[0176]
则在高维特征空间中的协方差矩阵为
[0177][0178]
因此,高维特征空间中的pca是求解方程
[0179][0180]
中的特征值λ和特征向量ν,进而有
[0181][0182]
注意到上式中特征向量ν可以由φ(xk)(k=1,2,...,m)线性表示出,即
[0183][0184]
其中αi为φ(xi)的系数,由式(22)~式(24)得
[0185][0186]
定义m
×
m矩阵k:
[0187]kij
≡φ(xi)
·
φ(xj)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(26)
[0188]
式(25)简化为
[0189]
mλkα=k2α
ꢀꢀꢀꢀꢀꢀꢀ
(27)
[0190]
其中α是m
×
1的向量,第j个元素为αj,显然满足
[0191]
mλα=kα
ꢀꢀꢀꢀꢀꢀꢀ
(28)
[0192]
则必然满足式(27)。通过对式(28)的求解,以及联合式(24)即可获得方差贡献率大的特征值(对应较大的特征值)及与之对应的特征向量。
[0193]
若假设式(20)不成立,则此时式(28)中的k用代替。
[0194][0195]
式中1
ij
=1(对于所有的i,j)。
[0196]
通过分别计算高维特征空间中的特征数据φ(x1),φ(x2),...,φ(xm)在前n个最大的特征值λ1,λ2,...,λn(前n个最大特征值的累计方差贡献率应达到90%以上)所对应的特征向量ν1,ν2,

,νn上的投影值,即可得到降维后维数为n的特征数据。
[0197]
上述一般的kpca算法通过使用方差贡献率来选择特征向量,从而完成对高维特征空间中的特征数据的降维,具有较好的数据降维效果,但是在整个降维过程中只考虑最大化地保留样本的总特征信息量(特征值代表了对应特征向量方向上包含的信息量)而没有考虑样本的类别信息,即只从数学角度考虑矩阵主要成分而没有考虑实际样本的分类问题,这会导致降维后的特征量对于异常数据的分类并没有很好的效果。
[0198]
而对于分类问题来说,特征提取的目的就是要提取出有利于后续分类的特征组合,为此本发明提出了一种改进的kpca算法,通过各特征向量的类内聚集程度和类间离散
程度来度量类别信息,不仅保留了较好的降维效果,而且使得降维后的特征数据更有利于后续的模式分类。每个特征向量的类内聚集程度描述为:
[0199][0200]
式中:为第i类数据的第k个特征向量的方差,c为类别数,每个特征向量的类间离散程度为:
[0201][0202]
式中:li表示第i类样本数目,表示第i类的第n个样本的第k个特征向量值,那么由式(30)、(31)得出类别的信息度量jk为:
[0203][0204]
根据公式(32)可知,jk越小就说明类别信息量越大,那么就越容易进行分类,即这个特征向量方向上包含的类别信息量越大。但并不是类别信息量越大就越能提高分类准确率,有些特征向量方向上包含的类别信息量大,但不一定会对分类效果起到积极的作用。因此,本发明使用相似度来衡量提取的各特征向量与样本的类别向量之间的相关性,通过特征向量与样本类别向量间的相关系数来选取特征向量的组合,去除对分类效果不明显的特征向量,其公式为:
[0205][0206]
式中:ξ为特征向量与样本类别属性向量的相关系数;vi为特征向量(其中i=1,2,3,

,n);vz是原样本中的类别属性向量。若ξ的绝对值大于零或等于1,则说明两特征向量是相关的;若ξ相似趋于或等于0,则说明两向量是不相关的。通过计算特征向量与样本的类别向量间的相关系数ξ,排除不相关或相关系数非常小的特征向量,去掉后会减小后续分类器的计算量,从而减小了分类的训练和识别时间。
[0207]
改进的kpca的具体降维步骤总结如下:
[0208]
假设输入空间中有m组特征数据,每组特征数据有n个特征属性(不包含类别特征),根据改进的kpca原理,特征提取的具体实现过程为:
[0209]
(1)列出一个(m
×
n)维数据矩阵,其中m为样本个数,n为每个样本的属性个数;
[0210]
(2)通过一般的kpca算法求解式(28)并联合式(24),求得高维特征空间中的协方差矩阵的特征值及对应的特征向量;
[0211]
(3)求取各特征向量的信息度量jk,按照信息度量jk从小到大的顺序,对相应的特征向量进行排序;
[0212]
(4)提取前m个特征向量ν1,ν2,...,νm,从第一个特征向量ν1开始,依次根据式(33)计算ν1,ν2,...,νm与原样本中的类别属性向量vz的相关系数ξ;
[0213]
(5)从步骤(4)中找到与类别向量vz的相关系数ξ为0或趋于0的特征向量,将其从
特征向量组中去除,得到剩余的n个特征向量;
[0214]
(6)对剩余特征向量按照相关系数从大到小的顺序重新排列;
[0215]
(7)通过分别计算高维特征空间中的特征数据在剩余的特征向量上的投影值,即可得到降维后维数为n的且分类效果较好的特征数据。
[0216]
本发明的具体实现过程如图1所示。首先利用局部放电信号采集单元采集现场检测的gis局部放电信号;然后对采集的gis局部放电信号进行有效数据的提取,由于gis局部放电脉冲出现前和衰减完后的数千个采样数据点基本不包含有效的放电信息,因此只截取信号中间的一段放电脉冲数据进行特征参数的提取,将放电脉冲出现前和衰减完后的数据进行去除;接着对局部放电信号时域波形的电压值取绝对值,得到局部放电信号的单极性波形,然后利用hilbert变换求取该单极性波形的包络,得到局部放电信号的时域波形包络;在完成时域波形包络的提取后,对放电信号波形进行快速傅里叶变换,将信号的波形由时域变换到频域中,然后利用hilbert变换求取放电信号的频谱包络;基于信号的时域波形包络和频谱包络来提取时域特征参数和频域特征参数,并联合统计特征参数共同构建放电特征数据;最后利用改进的核主成分分析法对提取的局部放电特征数据进行降维处理,最终得到维数较低的且能正确执行局部放电分类的特征数据。
[0217]
以某次现场试验测得的gis局部放电信号的特征提取为例,其原始数据如图2所示。对该放电信号进行有效数据的提取,去除不包含放电信息的无效信号数据,结果如图3所示。利用hilbert变换求取该放电信号的时域波形包络和频谱包络,结果如图4、图5所示。基于信号的时域波形包络和频谱包络来提取时域特征参数和频域特征参数,并联合统计特征参数共同构建放电特征数据,利用改进的核主成分分析法对提取的放电特征数据进行降维处理,最终得到维数较低的且能正确执行局部放电分类的特征数据。
[0218]
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
[0219]
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
[0220]
以上这些实施例应理解为仅用于说明本发明而不用于限制本发明的保护范围。在阅读了本发明的记载的内容之后,技术人员可以对本发明作各种改动或修改,这些等效变化和修饰同样落入本发明权利要求所限定的范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1