基于小样本学习的绝缘子污秽放电状态识别方法及系统与流程

文档序号:27386222发布日期:2021-11-15 21:24阅读:294来源:国知局
基于小样本学习的绝缘子污秽放电状态识别方法及系统与流程

1.本发明属于电力设备在线监测技术,具体涉及一种基于小样本学习的绝缘子污秽放电状态识别方法及系统。


背景技术:

2.我国电网容量等级的不断提高以及环境污染的影响,部分地区特别是沿海地区绝缘子污闪事故不断发生。在线运行的绝缘子串表面会逐渐沉积污秽,在有雾、露、毛毛雨以及融雪等潮湿天气下,污秽层受潮形成导电层降低绝缘子串的绝缘性能,提高污闪事故可能性,这威胁到输电线路的安全稳定运行。随着在线监测技术的迅猛发展,现有的监测方法如超声检测、紫外脉冲方法、激光法各有其特点,但存在其固有的不足,目前还没有有效的绝缘子污秽放电状态识别的方法。由于绝缘子污秽放电实际上是能量突然释放的过程,会对周围的介质产生压力,这一压力使空气振动,就产生了声波,即绝缘子污秽放电引起声发射现象。在绝缘子发生污闪(即最初的电晕放电到局部放电,以及由局部放电发展成的闪络)的整个过程中,声信号一直存在。绝缘子污秽放电产生的声波信号可以真实反映绝缘子污秽放电过程,通过监测声波信号可以判断绝缘子的放电状态,正确判断绝缘子的污秽程度并发出相应的报警信息,使运维人员能够及时采取措施防止污闪发生。现有的对于放电声信号的处理采用支持向量机和隐马尔可夫模型等经典机器学习方法,需要人工设计提取特征并识别,适用范围小、泛化能力不强,对于新信号的识别准确率不高,而单纯采用卷积神经网络技术(cnn)对声音信号分类识别虽然无需人工提取特征,但是往往模型参数量巨大,容易过拟合,而且需要大规模训练数据样本,对于样本的获取和标注准确性要求非常高而难以实际运用。


技术实现要素:

3.本发明要解决的技术问题:针对现有技术的上述问题,提供一种基于小样本学习的绝缘子污秽放电状态识别方法及系统,本发明基于数据增强和图神经网络(gnn)模型通过小样本学习能够实现对绝缘子污秽放电状态,可以利用相对少量的绝缘子污秽放电声音样本进行机器学习,提高绝缘子污秽放电状态的识别准确率和稳定性,节省了人力物力成本,同时考虑到了实际运行状态下的噪声影响,因此可得到与实际情况更加吻合的绝缘子污秽放电状态。
4.为了解决上述技术问题,本发明采用的技术方案为:
5.一种基于小样本学习的绝缘子污秽放电状态识别方法,包括训练用于将目标绝缘子的声音信号映射为目标绝缘子的污秽放电状态的图神经网络模型的步骤:
6.1)采集绝缘子在在不同污秽程度下的声音样本信号,并对声音样本信号的放电状态进行标注,从而得到带有标签向量的声音样本信号数据集;
7.2)针对声音样本信号数据集中的声音样本信号通过短时傅里叶变换获得语谱图;
8.3)通过对语谱图进行变换以扩充声音样本信号数据集中的样本量;
9.4)将语谱图输入预先训练好的特征提取神经网络提取得到特征向量,利用特征向量及其对应的标签向量作为输入来训练所述图神经网络模型,从而建立目标绝缘子的声音信号、目标绝缘子的污秽放电状态之间的映射关系。
10.可选地,步骤1)中对声音样本信号的放电状态进行标注时,声音样本信号的放电状态包括未放电、电晕放电、污秽放电以及沿面闪络。
11.可选地,步骤1)之后、步骤2)之前还包括针对声音样本信号数据集中的声音样本信号滤掉低频和高频成分的步骤。
12.可选地,所述针对声音样本信号数据集中的声音样本信号滤掉低频和高频成分时,采用的滤波器为数字带通滤波器,且所述数字带通滤波器的上限截止频率f
p2
=40khz、下限截止频率f
p2
=8khz,使得保留的声音样本信号的频带范围为8khz~40khz。
13.可选地,步骤2)中通过短时傅里叶变换获得语谱图时,语谱图频域选取为8khz~40khz,所述语谱图中包含声音信号的时间、频率以及幅值信息,且幅值信息以颜色的深浅表示。
14.可选地,步骤3)中通过对语谱图进行变换以扩充声音样本信号数据集中的样本量时,对语谱图进行变换的方式为局部灰度转换。
15.可选地,步骤3)中通过对语谱图进行变换以扩充声音样本信号数据集中的样本量时,对语谱图进行变换的方式为生成深度卷积对抗网络。
16.可选地,步骤3)中通过对语谱图进行变换以扩充声音样本信号数据集中的样本量时,对语谱图进行变换的方式为时域循环移位。
17.此外,本发明还提供一种小样本学习的绝缘子污秽放电状态识别系统,包括相互连接的微处理器和存储器,该微处理器被编程或配置以执行所述基于小样本学习的绝缘子污秽放电状态识别方法的步骤。
18.此外,本发明还提供一种计算机可读存储介质,该计算机可读存储介质中存储有被编程或配置以执行所述基于小样本学习的绝缘子污秽放电状态识别方法的计算机程序。
19.和现有技术相比,本发明具有下述优点:
20.1、本发明包括针对声音样本信号数据集中的声音样本信号通过短时傅里叶变换获得语谱图,通过对语谱图进行变换以扩充声音样本信号数据集中的样本量,将语谱图输入预先训练好的特征提取神经网络提取得到特征向量,利用特征向量及其对应的标签向量作为输入来训练图神经网络模型,利用语谱图便于变换的特性,可实现扩充声音样本信号数据集中的样本量,更加适用于小样本数据的学习,能够有效提高图神经网络模型的识别率。
21.2、本发明包括通过对语谱图进行变换以扩充声音样本信号数据集中的样本量,有效扩充了样本量,解决了实际工程运行中绝缘子放电声信号难以获取和标注不规范的问题。
附图说明
22.图1为本发明实施例一训练方法的基本流程示意图。
23.图2为本发明实施例一获得的语谱图示例。
24.图3为本发明实施例一训练方法的详细流程示意图。
25.图4为本发明实施例一中训练原理示意图。
26.图5为本发明实施例一中的系统结构示意图。
27.图6为本发明实施例三的dcgan网络结构示意图。
具体实施方式
28.实施例一:
29.如图1所示,本实施例基于小样本学习的绝缘子污秽放电状态识别方法包括训练用于将目标绝缘子的声音信号映射为目标绝缘子的污秽放电状态的图神经网络模型的步骤:
30.1)采集绝缘子在在不同污秽程度下的声音样本信号,并对声音样本信号的放电状态进行标注,从而得到带有标签向量的声音样本信号数据集;
31.2)针对声音样本信号数据集中的声音样本信号通过短时傅里叶变换获得语谱图;
32.3)通过对语谱图进行变换以扩充声音样本信号数据集中的样本量;
33.4)将语谱图输入预先训练好的特征提取神经网络提取得到特征向量,利用特征向量及其对应的标签向量作为输入来训练所述图神经网络模型,从而建立目标绝缘子的声音信号、目标绝缘子的污秽放电状态之间的映射关系。
34.需要说明的,本实施例基于小样本学习的绝缘子污秽放电状态识别方法不依赖于绝缘子的材质,绝缘子可为陶瓷绝缘子或玻璃绝缘子。
35.本实施例中,步骤1)中采集绝缘子在在不同污秽程度下的声音样本信号时,每个声音样本信号采集时长为2s。此外,也可以根据需要设置声音样本信号的采样时长。
36.本实施例中,步骤1)中对声音样本信号的放电状态进行标注时,声音样本信号的放电状态包括未放电、电晕放电、污秽放电以及沿面闪络。同样地,本实施例基于小样本学习的绝缘子污秽放电状态识别方法不依赖于特定的放电状态,其完全可以根据绝缘子的材质、绝缘子的形状以及绝缘子所处的环境或场景下选择可能的放电状态来进行标注。
37.步骤2)中通过短时傅里叶变换获得语谱图可方便地采用matlab或者python编程实现。此外,也可以根据需要采用其他工具或编程语言实现。本实施例基于小样本学习的绝缘子污秽放电状态识别方法通过短时傅里叶变换获得语谱图不依赖于特定的工具或编程语言。
38.经过进一步试验发现,绝缘子在在不同污秽程度下有效的声音样本信号大多集中在8khz~40khz的频段内。因此为了进一步提升降低环境噪声和系统噪声的干扰的效果,参见图3,本实施例步骤2)中通过短时傅里叶变换获得语谱图时,语谱图频域选取为8khz~40khz,语谱图中包含声音信号的时间、频率以及幅值信息,且幅值信息以颜色的深浅表示。本实施例中,语谱图的像素高度为256,具体的语谱图示例如图2所示。
39.需要说明的是,参见图3,本实施例中步骤3)中通过对语谱图进行变换以扩充声音样本信号数据集中的样本量可以根据需要采用各类数据增强的方法,包括局部灰度转换、生成深度卷积对抗网络(dcgan)、时域循环移位、时域拉伸、饱和度增强、对比度增强等方法,通过对语谱图进行变换以扩充声音样本信号数据集中的样本量,有效扩充了样本量,解决了实际工程运行中绝缘子放电声信号难以获取和标注不规范的问题。
40.作为一种可选的实施方式,本实施例步骤3)中通过对语谱图进行变换以扩充声音
样本信号数据集中的样本量时,对语谱图进行变换的方式为局部灰度转换(local grayscale transformation,lgt)。具体方法如下:
41.s1)输入语谱图,语谱图的高度和宽度分别为h和w,图像的面积s=w*h。初始化设置灰度转换面积比例为r,转换矩形区面积为s
t
=s*r,限定灰度转换区长和宽分别为h
t
和w
t
,二者满足h
t
*w
t
=s
t

42.s2)利用随机函数rand(0,w)和rand(0,h)生成灰度转换区的左上角坐标x
l
和y
l
。,从而确定灰度转换区的右下角坐标(x
l
+w
t
,y
l
+h
t
)。
43.s3)判断灰度转换区的右下角坐标(x
l
+w
t
,y
l
+h
t
)是否在语谱图的图像范围内,由此判别灰度转换区是否位于语谱图的范围内,如果是,将语谱图中对应灰度转换区进行灰度转换,否则若样本量仍然尚未满足要求,则跳转执行步骤s2)以继续扩充样本。其中,灰度转换为现有方法,可采用下述函数表达式表示:g=t(r,g,b),其中t()是灰度转换函数,通过在原始图像通道上应用灰度变换函数逐像素进行累加计算得到,转换后的图像添加和原来图像一样的样本标签。由于灰度转换函数为现有公知函数,其具体表达式在此不再列出。
44.本实施例步骤4)中利用预先训练好的特征提取神经网络提取从语谱图中特征向量,特征提取神经网络可以根据需要采用cnn网络或者lstm网络等嵌入式网络,其本质上是对语谱图进行下采样以提取特征,采用不同特征提取神经网络可能会对绝缘子污秽放电状态识别的准确度或多或少存在一些差异。
45.作为一种可选的实施方式,本实施例中特征提取神经网络采用cnn网络,该cnn网络为一个输入层+两个(卷积层+池化层)的组合+一个全连接层构成的轻量级cnn网络。语谱图在输入层输入后,分别通过卷积层、池化层进行处理,然后在全连接层进行全连接后通过激活函数激活,即可获得语谱图中特征向量。
46.如图4所示,本实施例中以一个4 way

2 shots的任务为例进行说明。标签总共四个分类,分别是未放电、电晕放电、污秽放电、沿面闪络,每种分类在数据集中采用2个样本作为支持集图片。将带有标签的支持集(support set)语谱图和一个查询集(query set),支持集中还有8个带标签的样本(x11,x12,x13,x14,x21,x22,x23,x24,),查询集中含有两个不带标签的样本将上述语谱图输入cnn网络以后获得对应的特征向量将和标签向量t(l)级联后作为图神经网络模型(gnn网络)的输入,送入图神经网络模型(gnn网络)中进行学习。
47.本实施例中采用图神经网络模型在训练以建立目标绝缘子的声音信号、目标绝缘子的污秽放电状态之间的映射关系。图神经网络模型为现有的神经网络模型,图神经网络模型gnn是由许多节点(node)和边组成的图,在本实施例中每个节点都代表一张输入的语谱图,而每个边的权重表示两个节点(即语谱图)之间的相似程度,本实施例中采用稠密连接,边每个节点都两两连接,邻接矩阵存储每两张图之间的权重,权值由一个多层感知机(mlp,multilayer perceptron)计算得到,计算公式为:
[0048][0049]
上式中,表示第k层网络中第i,j个节点之间邻接矩阵(权值),表示一个输入为两个节点之间的多层感知机(输入为两个节点之间的绝对差,输出为对
应两个节点的权重值),为多层感知机的函数模型,为两个节点之间的绝对值,k表示第k层网络(图神经网络模型gnn具有k层网络),i,j表示第i,j个节点,θ是一个可训练的参数。通过在图神经网络模型gnn中训练后即可建立目标绝缘子的声音信号、目标绝缘子的污秽放电状态之间的映射关系,从而获得完成训练的图神经网络模型gnn,可用于对查询集中的样本给出分类预测结果(未放电、电晕放电、污秽放电、沿面闪络中的一个)。本实施例中,图神经网络模型gnn采用的损失函数为交叉熵:
[0050][0051]
上式中,l(φ(γ;θ),y)是损失函数,y*表示节点*的标签,y
k
表示输入向量中的标签值,y
kk
是符号函数(如果样本的真实类别等于y
k
,取1,否则取0),表示预测标签为y
k
的概率,φ是模型,θ是参数矩阵,y是标签向量,γ表示步骤4)的整体输入,整体输入由两个部分组成:带标签的数据集,不带标签的查询集,如图4所示。gnn网络的输出为y={y1,y2}∈{1,k}t,对本实施例中而言,有k=4,t=2。对于k way

n shot任务的k的值可以根据样本量的大小进行调节,t可以根据需要判别的不带标签的样本数量进行调整。此外,对于数据集中可以添加无标签的样本,可以适当修改gnn结构以进行半监督或者主动学习。
[0052]
综上所述,本实施例方法考虑到实际运行状态下的噪声影响,可得到与实际情况更加吻合的绝缘子污秽放电状态,其通过基于数据增强和图神经网络(gnn)的小样本学习对绝缘子污秽放电状态建立模型,可以利用相对较小的绝缘子污秽放电状态样本进行机器学习,提高绝缘子污秽放电状态的识别准确率和稳定性,节省了人力物力成本,具有重要的工程意义。
[0053]
在一些具体的实例中,本实施例还提供一种基于小样本学习的绝缘子污秽放电状态识别的系统,如图5所示,包括:采集模块、降噪模块、转换模块、训练模块、显示模块。所述采集模块用于获取目标绝缘子在不同程度污秽环境条件下的不同放电状态的声信号数据集;所述降噪模块用于降低环境噪声和系统噪声的干扰;所述转换模块用于利用短时傅里叶变换将声信号转换为语谱图;所述训练模块用于将语谱图分成数据集、查询集,将所示样本数据集训练放入图神经网络中进行学习;所述显示模块将待识别的绝缘子运行时的声信号在图神经网络模型中得到的所述绝缘子的放电状态进行显示。
[0054]
应当理解,上述单元模块的具体实现过程参照方法内容,本发明在此不进行具体的赘述,且上述功能模块单元的划分仅仅是一种逻辑功能的划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。同时,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0055]
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。可以一种或多种程序设计语言,包括java、smalltalk、c++、python或类似的程序设计语言,或其组合来编写用于执行本公开的实施例的操作的计算机程序代码。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的
情形中,远程计算机可以通过任意种类的网络——包括局域网(lan)或广域网(wan)——连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
[0056]
在一些具体的实例中,本实施例还提供一种小样本学习的绝缘子污秽放电状态识别系统,包括相互连接的微处理器和存储器,该微处理器被编程或配置以执行所述基于小样本学习的绝缘子污秽放电状态识别方法的步骤。在一些具体的实例中,本实施例还提供一种计算机可读存储介质,该计算机可读存储介质中存储有被编程或配置以执行所述基于小样本学习的绝缘子污秽放电状态识别方法的计算机程序。
[0057]
实施例二:
[0058]
本实施例是对实施例一的进一步改进。由于在采集绝缘子在在不同污秽程度下的声音样本信号时,采集得到的声音样本信号必然包含环境噪声和系统噪声,环境噪声和系统噪声会对声音样本信号存在干扰,影响绝缘子污秽放电状态识别的准确度。
[0059]
为了降低环境噪声和系统噪声的干扰,提高了识别模型的适应性,本实施例中在实施例一的基础上,在步骤1)之后、步骤2)之前还包括针对声音样本信号数据集中的声音样本信号滤掉低频和高频成分的步骤。由于绝缘子在在不同污秽程度下有效的声音样本信号一般为一定频率内的信号,而环境噪声和系统噪声为低频或高频成分,因此滤掉低频和高频成分可在一定程度上降低环境噪声和系统噪声的干扰,提高了识别图神经网络模型的适应性,同时根据绝缘子放电信号频率的特征限定了样本声信号的频率范围,对于降低样本信号复杂度、减小模型复杂度有着较大作用。
[0060]
此外,经过进一步试验发现,绝缘子在在不同污秽程度下有效的声音样本信号大多集中在8khz~40khz的频段内。因此为了进一步提升降低环境噪声和系统噪声的干扰的效果,本实施例中在针对声音样本信号数据集中的声音样本信号滤掉低频和高频成分时,采用的滤波器为数字带通滤波器,且所述数字带通滤波器的上限截止频率f
p2
=40khz、下限截止频率f
p2
=8khz,使得保留的声音样本信号的频带范围为8khz~40khz,这样设置可以最大程度保留有效信息,并降低噪声对建立的模型复杂度和准确度的影响。通过上述手段,可根据绝缘子放电信号频率的特征限定了样本声信号的频率范围,对于降低样本信号复杂度、减小模型复杂度有着较大作用。
[0061]
作为一种可选的实施方式,本实施例中的数字带通滤波器选用巴特沃斯滤波器,其特点是通频带内的频率响应曲线最大限度平坦,没有起伏,而在阻频带则逐渐下降为零。通过设置其上限截止频率f
p2
=40khz,下限截止频率f
p2
=8khz,可有效提升降低环境噪声和系统噪声的干扰的效果。
[0062]
在一些具体的实例中,本实施例还提供一种小样本学习的绝缘子污秽放电状态识别系统,包括相互连接的微处理器和存储器,该微处理器被编程或配置以执行所述基于小样本学习的绝缘子污秽放电状态识别方法的步骤。在一些具体的实例中,本实施例还提供一种计算机可读存储介质,该计算机可读存储介质中存储有被编程或配置以执行所述基于小样本学习的绝缘子污秽放电状态识别方法的计算机程序。
[0063]
实施例三:
[0064]
本实施例与实施例一基本相同,其主要不同点为步骤3)中通过对语谱图进行变换以扩充声音样本信号数据集中的样本量时,对语谱图进行变换的方式不同。
[0065]
本实施例中,步骤3)中通过对语谱图进行变换以扩充声音样本信号数据集中的样本量时,对语谱图进行变换的方式为生成深度卷积对抗网络(dcgan)。生成深度卷积对抗网络(dcgan)为现有的神经学习网络。
[0066]
如图6所示,深度卷积生成对抗网络是在生成对抗网络(gan)的基础上改进网络结构得到,在生成器g(generator)和判别器(discriminator)加入两个卷积神经网络,提高gan训练的稳定性和生成速度。为了提高生成样本的质量并加快收敛速度,在g和d的网络中,都取消了池化层(pooling layer),并分别使用转置卷积和加入步长(stride)的卷积替代。d和g中均可使用批归一化(batch normalization),g和d中分别使用relu和leakyrelu作为激活函数,g最后一层使用tanh函数。g的噪声输入使用高斯噪声和在非运行状态下采集的绝缘子运行环境噪声。将未放电、电晕放电、污秽放电、沿面闪络的样本分别作为原始样本进行处理,获得的新样本添加原来的语谱图一样的样本标签。
[0067]
在一些具体的实例中,本实施例还提供一种小样本学习的绝缘子污秽放电状态识别系统,包括相互连接的微处理器和存储器,该微处理器被编程或配置以执行所述基于小样本学习的绝缘子污秽放电状态识别方法的步骤。在一些具体的实例中,本实施例还提供一种计算机可读存储介质,该计算机可读存储介质中存储有被编程或配置以执行所述基于小样本学习的绝缘子污秽放电状态识别方法的计算机程序。
[0068]
实施例四:
[0069]
本实施例与实施例一基本相同,其主要不同点为步骤3)中通过对语谱图进行变换以扩充声音样本信号数据集中的样本量时,对语谱图进行变换的方式不同。
[0070]
本实施例中,步骤3)中通过对语谱图进行变换以扩充声音样本信号数据集中的样本量时,对语谱图进行变换的方式为时域循环移位。语谱图中时域(y轴)上共有n个数据点,时域循环移位的步骤包括:取整(n/10)作为循环取样的步长m,从1

n进行遍历获得第i个点,将遍历得到的第i个点的频率及该频率处幅值信息传递到第i+m处,如果i+m>n,将该点信息传递到第i+m

n处,由此生成新的语谱图。其中取整的被除数10可以根据实际的采样点个数进行调整。转换后的图像添加和原来图像一样的样本标签。
[0071]
在一些具体的实例中,本实施例还提供一种小样本学习的绝缘子污秽放电状态识别系统,包括相互连接的微处理器和存储器,该微处理器被编程或配置以执行所述基于小样本学习的绝缘子污秽放电状态识别方法的步骤。在一些具体的实例中,本实施例还提供一种计算机可读存储介质,该计算机可读存储介质中存储有被编程或配置以执行所述基于小样本学习的绝缘子污秽放电状态识别方法的计算机程序。
[0072]
应当理解,在本发明实施例中,所称处理器可以是中央处理单元(central processing unit,cpu),该处理器还可以是其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现成可编程门阵列(field

programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。存储器可以包括只读存储器和随机存取存储器,并向处理器提供指令和数据。存储器的一部分还可以包括非易失性随机存取存储器。例如,存储器还可以存储设备类型的信息。
[0073]
所述可读存储介质为计算机可读存储介质,其可以是前述任一实施例所述的控制
器的内部存储单元,例如控制器的硬盘或内存。所述可读存储介质也可以是所述控制器的外部存储设备,例如所述控制器上配备的插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)等。进一步地,所述可读存储介质还可以既包括所述控制器的内部存储单元也包括外部存储设备。所述可读存储介质用于存储所述计算机程序以及所述控制器所需的其他程序和数据。所述可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。
[0074]
需要强调的是,本发明所述的实例是说明性的,而不是限定性的,以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1