局部放电信号的模式识别方法、装置、设备及存储介质与流程

文档序号:21358210发布日期:2020-07-04 04:31阅读:199来源:国知局
局部放电信号的模式识别方法、装置、设备及存储介质与流程

本申请涉及高电压绝缘技术领域,尤其涉及一种局部放电信号的模式识别方法、装置、设备及存储介质。



背景技术:

局部放电是高压绝缘系统中的一种绝缘劣化的现象,是导致电气设备绝缘失效的重要原因。另外,超高频(uhf)方法由于抗干扰能力强、灵敏度高等特点,在局部放电现场信号检测中得到了广泛的应用。高电压模拟实验是一类局部放电信号的模拟技术,它为局部放电模式的识别的研究起到了基础性的作用。

目前实验室对于局部放电的模拟均采用高压实验系统来配合各类真型局部放电试验模型进行放电图谱的仿真,存在体积庞大和难以移动等缺点,因此只能在高压大厅等特定环境进行试验,且还有试验设备搭建困难,试验周期长,试验电源为工频或者直流电压等单一形式的问题。

人工神经网络等人工智能机器人的学习方法也被广泛的应用于局部放电的模式识别研究中。然而,由于局部放电现象具有随机性,对检测设备的要求较高,因此需要获得大量的局部放电数据以建立高性能的分类模型不仅困难而且费用昂贵。并且在没有大规模的数据库的情况下,机器学习方法更有可能过度拟合训练数据,降低局部放电模式识别的精度。



技术实现要素:

本申请提供了一种局部放电信号的模式识别方法、装置、设备及存储介质,通过生成新的数据以及扩充数据集,解决了现有技术中的数据采样困难,模式识别精度不高的技术问题。

本申请第一方面提供了一种局部放电信号的模式识别方法,包括:

获取局部放电数据,对所述局部放电数据进行预处理,以预处理后的数据作为训练条件生成对抗网络的数据集,并将所述数据集分为训练数据集和测试数据集;

根据训练目标构造条件生成对抗网络模型和机器学习分类器;

在所述训练数据集中,训练所述条件生成对抗网络模型;

将随机噪声信号输入所述条件生成对抗网络模型的生成器,以使所述生成器生成新的局部放电数据,根据所述新的局部放电数据获得新的数据集;

在所述新的数据集中训练所述机器学习分类器后,在所述测试数据集中验证所述机器学习分类器的准确率。

可选地,所述获取局部放电数据之前包括:通过高电压试验系统配合多种局部放电试验模型进行信号实验,并获取局部放电数据。

可选地,所述条件生成对抗网络模型包括基于神经网络的生成器和基于神经网络的判别器。

可选地,所述生成器包括5层神经网络,所述5层神经网络的激活函数均为relu函数。

可选地,所述判别器包括4层神经网络,所述4层神经网络的激活函数均为relu函数。

可选地,所述根据训练目标构造条件生成对抗网络模型和机器学习分类器具体包括:根据训练目标构造条件生成对抗网络模型和机器学习分类器;定义所述条件生成对抗网络模型的损失函数和定义所述机器学习分类器的损失函数。

本申请第二方面提供了一种局部放电信号的模式识别装置,包括:

生成数据集模块,用于获取局部放电数据,对所述局部放电数据进行预处理,以预处理后的数据作为训练条件生成对抗网络的数据集,并将所述数据集分为训练数据集和测试数据集;

生成模块,用于根据训练目标构造条件生成对抗网络模型和机器学习分类器;

训练模块,用于在所述训练数据集中,训练所述条件生成对抗网络模型;

生成新数据集模块,用于将随机噪声信号输入所述条件生成对抗网络模型的生成器,以使所述生成器生成新的局部放电数据,根据所述新的局部放电数据获得新的数据集;

验证模块,用于在所述新的数据集中训练所述机器学习分类器后,在所述测试数据集中验证所述机器学习分类器的准确率。

可选地,所述生成数据集模块还用于通过高电压试验系统配合多种局部放电试验模型进行信号实验,并获取局部放电数据。

本申请第三方面提供了一种局部放电信号的模式识别设备,所述设备包括处理器以及存储器:

所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;

所述处理器用于根据所述程序代码中的指令执行第一方面所述的局部放电信号的模式识别方法。

本申请第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行第一方面所述的局部放电信号的模式识别方法。

从以上技术方案可以看出,本申请实施例具有以下优点:

本申请中,提供了一种局部放电信号的模式识别方法,包括:

获取局部放电数据,对所述局部放电数据进行预处理,以预处理后的数据作为训练条件生成对抗网络的数据集,并将所述数据集分为训练数据集和测试数据集;

根据训练目标构造条件生成对抗网络模型和机器学习分类器;

在所述训练数据集中,训练所述条件生成对抗网络模型;

将随机噪声信号输入所述条件生成对抗网络模型的生成器,以使所述生成器生成新的局部放电数据,根据所述新的局部放电数据获得新的数据集;

在所述新的数据集中训练所述机器学习分类器后,在所述测试数据集中验证所述机器学习分类器的准确率。

本申请提供的局部放电信号的模式识别方法,将条件生成对抗网络模型应用于局部放电信号的识别中。条件生成对抗网络模型由两个部分组成,分别是生成器(g)和鉴别器(d)。条件生成对抗网络能够学习数据的深层特征,并生成逼真的数据。通过条件生成对抗网络来产生大量的可靠的多样化的数据,减少人工高电压实验来采集数据的麻烦,同时还能提升局部放电信号的模式识别精度。通过条件生成对抗网络来生成局部放电信号,来弥补现有技术中的放电实验中所获得的数据集很小以及数据多样化不够的技术缺陷。利用条件生成局部放电数据,通过生成的数据来扩充训练数据集,然后用扩充后的训练集来训练分类器,从而降低分类的过拟合风险,从而提高了模型的准确率。本申请通过生成新的数据来扩充数据集,解决了现有技术中的数据采样困难,模式识别精度不高的技术问题。

附图说明

图1为本申请提供的一种局部放电信号的模式识别方法的一个实施例的流程示意图;

图2为本申请提供的一种局部放电信号的模式识别方法的另一个实施例的流程示意图;

图3为本申请提供的一种局部放电信号的模式识别方法的一个实施例的条件生成对抗网络的结构示意图;

图4为本申请提供的一种局部放电信号的模式识别方法的一个实施例的条件生成对抗网络的训练过程的示意图;

图5为本申请提供的一种局部放电信号的模式识别方法的一个实施例的基于条件生成对抗网络的数据集扩充流程图;

图6为本申请提供的一种局部放电信号的模式识别方法的一个实施例合成的尖端放电信号图一;

图7为本申请提供的一种局部放电信号的模式识别方法的一个实施例合成的尖端放电信号图二;

图8为本申请提供的一种局部放电信号的模式识别方法的一个实施例合成的尖端放电信号图三;

图9为本申请提供的一种局部放电信号的模式识别方法的一个实施例合成的悬浮放电信号图一;

图10为本申请提供的一种局部放电信号的模式识别方法的一个实施例合成的悬浮放电信号图二;

图11为本申请提供的一种局部放电信号的模式识别方法的一个实施例合成的悬浮放电信号图三;

图12为本申请提供的一种局部放电信号的模式识别方法的一个实施例合成的沿面放电信号图一;

图13为本申请提供的一种局部放电信号的模式识别方法的一个实施例合成的沿面放电信号图二;

图14为本申请提供的一种局部放电信号的模式识别方法的一个实施例合成的沿面放电信号图三;

图15为本申请提供的一种局部放电信号的模式识别装置的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

本申请实施例提供的一种局部放电信号的模式识别方法、装置、设备及存储介质,通过生成新的数据以及扩充数据集,解决了现有技术中的数据采样困难,模式识别精度不高的技术问题。本申请所提供的一种局部放电信号的模式识别方法,可以实施在终端设备中,该终端设备可以以各种形式实施,包括而不仅限于台式计算机、笔记本电脑、移动终端、智能终端、平板电脑等用户终端设备以及单片机、嵌入式处理器、数字信号处理器(dsp)、专用集成电路芯片(asic)、现场可编程门阵列(fpga)等工业芯片(组)上。

参见图1,图1为本申请提供的一种局部放电信号的模式识别方法的流程示意图。

本申请实施例提供了一种局部放电信号的模式识别方法,包括:

100,获取局部放电数据,对局部放电数据进行预处理,以预处理后的数据作为训练条件生成对抗网络的数据集,并将数据集分为训练数据集和测试数据集;

需要说明的是,本申请实施例获取局部放电数据的方式可以为在绝缘缺陷模拟器上进行高电压模拟实验,由定向天线检测局部放电信号,示例性的,本申请实施例所采用的定向天线的天线带宽为470mhz~900mhz,所采用的示波器的采样率为5ghz,采样时间为300ns,每个局部放电信号有1500个采样点。

200,根据训练目标构造条件生成对抗网络模型和机器学习分类器;

需要说明的是,生成对抗网络的方法可以通过已有的采样数据,产生新的数据,条件生成对抗网络的主要思想来源于博弈论中的纳什均衡。

300,在训练数据集中,训练条件生成对抗网络模型;

需要说明的是,假设存在m个噪声信号{z(1),...,z(m)},服从先验分布pg(z)(例如z~n(0,1)),存在m个真实样本{x(1),...,x(m)}服从数据分布pdata(x)。

条件生成对抗网络的优化目标可以转化为以下公式的最小最大化的问题:

在生成器和判别器之间交替达到纳什平衡,当生成器不能提高合成数据的质量而判别器也不能确定输入数据属于哪里时,训练竞争会停止。

因此,假设给定一个生成器g,优化目标的全局最大值为:

此时,d(x)=0.5andpdata=pg,即表明判别器随机输出预测结果,此时的判别器失去了判断数据来源的能力。

示例性的,在图1所示的,经过不断的训练,使得网络的目标函数优化到最优值,此时可以认为该条件生成对抗网络模型已经训练完毕。通过训练条件生成对抗网络模型,使得该网络模型学习了鲁棒的和丰富的深度特征表示。可以用于生成新的局部放电数据样本,所生成的局部放电数据样本逼真到难以用肉眼分辨。经过训练后,零和博弈达到了“纳什均衡”的状态,意味着生成器和判别器的精度无法同时改进,当有一方的精确度提高时,必将损失另一方的精确度。建立了这种动态平衡后,生成器将恢复真实的数据分布并从真实的数据分布中生成合理的样本。此时的判别器将无法确定所生成的数据是真的样本还是假的样本。

400,将随机噪声信号输入条件生成对抗网络模型的生成器,以使生成器生成新的局部放电数据,根据新的局部放电数据获得新的数据集;

需要说明的是,考虑到局部放电检测的实际情况,实际场景所获得的数据会受到限制。当缺乏足够的数据时,深度学习模型会倾向于过度拟合训练数据集。为了在局部放电识别中充分利用深度学习模型的学习能力,可以通过生成模型来合成大量的超高频的局部放电信号,以此实现数据集的扩充。经过上述步骤中对于条件生成对抗网络模型的训练,只要将随机噪声信号输入到条件生成对抗网络中,该网络即可生成逼真的局部放电信号。条件生成对抗网络在原始训练数据集上进行训练,使得条件生成对抗网络生成更多的局部放电数据,以将这些局部放电数据填充到原始数据集中。

示例性的,可以从高斯分布中随机采样,产生6750个噪声信号,并将这些噪声信号输入到已经训练完成的条件生成对抗网络的生成器中,该生成器将产生6750个新的局部放电信号。图6-8是本公开方法生成的尖端放电数据,图9-11是本公开方法生成的悬浮放电数据,图12-14是本公开方法生成的沿面放电数据。我们将其随机分为三份,每份2250个新样本。将它们存储在硬盘中,供以下步骤使用。

500,在新的数据集中训练机器学习分类器后,在测试数据集中验证机器学习分类器的准确率。

需要说明的是,在本申请实施例中,分类器为一个具有两个隐藏层和relu激活的神经网络,第一层隐藏层包含512个神经元,第二层包含256个神经元。为了评估基于条件生成对抗网络的数据扩充的效果,在原始数据库中添加了不同数量生成的局部放电数据,组成了多个数据量不同的训练数据集。特别地,本申请实施例中的机器学习分类器可以为神经网络分类器。

示例性的,将测试分为四个阶段。第一,没有不使用基于can的数据扩充,使用原始的数据集训练神经网络分类器在原始测试集上进行准确率测试,得出的准确率为94.33%;第二,在原始数据的基础上增加(2250)前一个步骤中获得的新生成的局部放电数据样本,形成了一个两倍数据扩充的新训练集,在这个训练集上训练分类器可以得到准确率为95.67%;第三,在原始数据集的基础上增加两份(4500)个前一个步骤所生成的局部放电数据样本,形成了一个三倍数据扩充的新训练集,在该训练集上训练分类器可以得出准确率为95.53%;同理,可以形成一个四倍的数据扩充的新训练集,在该训练集上训练分类器,可以得到准确率为95.07%。根据分类结果,将相同数量的局部放电信号附加在原始训练数据集中,可获得更加的性能。随着扩充倍数的增加,所获得的平均精度依然高于原始数据集的精度。

为了便于理解,请参见图2,为本申请提供的一种局部放电信号的模式识别方法的另一个实施例的流程示意图;

进一步地,获取局部放电数据之前包括:110,通过高电压试验系统配合多种局部放电试验模型进行信号实验。

需要说明的是,示例性的,请参见图6-14,图6-8均为本申请提供的一种局部放电信号的模式识别方法的一个实施例合成的尖端放电信号图,图9-11均为本申请提供的一种局部放电信号的模式识别方法的一个实施例合成的悬浮放电信号图,图12-14均为本申请提供的一种局部放电信号的模式识别方法的一个实施例合成的沿面放电信号图。本申请实施例所采用的有三个设计的局部放电绝缘缺陷模拟器以及规模为:尖端放电,4.40kv,交流电环境;悬浮放电,3.46kv,交流电环境;沿面放电,5.48kv,交流电环境。对于每一个局部放电类型,均收集了1000个有效的局部放电信号,即建立一个具有3000个样本的局部放电信号的原始数据集。从该原始数据集中随机抽取2250个样本作为原始训练数据集,剩下的750个样本作为原始测试数据集。

进一步地,条件生成对抗网络模型包括基于神经网络的生成器和基于神经网络的判别器。

需要说明的是,请参见图3,为本申请提供的一种局部放电信号的模式识别方法的一个实施例的条件生成对抗网络的结构示意图;条件生成对抗网络模型包括:生成器(g)和鉴别器(d)。其中,生成器用于生成新的样本,鉴别器用于生成新的样本,判别器用于判断样本是否来自训练数据集。生成器的输入是随机噪声z,如果输入判别器的样本来自真实的样本x,判别器会把它归类为1。如果输入判别器的样本来自生成器生成的样本,将其分类为假,并将其标记为0。因为条件生成对抗网络模型是零和训练,所以在生成器和判别器之间交替训练,以实现纳什平衡。当建立了纳什平衡这种动态平衡,生成器将恢复真实的数据分布,并从该分布中生成合理的样本。此时,判别器将无法确定生成的数据是真是假。

进一步地,生成器包括5层神经网络,5层神经网络的激活函数均为relu函数。

需要说明的是,请参见图4,为本申请提供的一种局部放电信号的模式识别方法的一个实施例的条件生成对抗网络的训练过程的示意图;生成器由5层神经网络构成,每层神经元的个数分别为:100、256、512、1024、1500,每一层神经网络中的激活函数都是relu函数。生成器网络的输入层有100个神经元,也就是说输入噪声z是一个100维向量。当实际样品复杂,需要描述和恢复时,噪声z将是高维向量,反之是低维向量。当涉及到判别器网络的输入层时,生成器网络有1500个神经元,因为生成器网络的输出也是一个1500维向量。此外,生成器网络的输出维度应等于实际局部放电数据的维度。示例性的,本申请实施例采用5ghz采样率在300ns内对局部放电信号进行采样,得到1500个采样点(即1500维)的超高频局部放电信号。

进一步地,判别器包括4层神经网络,4层神经网络的激活函数均为relu函数。

需要说明的是,判别器由4层神经网络构成,每层神经元的个数分别为:1500、512、256、1,每层神经网络中的激活函数均为relu函数。

进一步地,根据训练目标构造条件生成对抗网络模型和机器学习分类器具体包括:根据训练目标构造条件生成对抗网络模型和机器学习分类器;定义条件生成对抗网络模型的损失函数和定义机器学习分类器的损失函数。

需要说明的是,请参见图5,为本申请提供的一种局部放电信号的模式识别方法的一个实施例的基于条件生成对抗网络的数据集扩充流程图。根据训练目标构造条件生成对抗网络模型和机器学习分类器包括:根据训练目标构造条件生成对抗网络模型和机器学习分类器;定义条件生成对抗网络模型的损失函数和定义机器学习分类器的损失函数;在训练数据集中,初始化条件生成对抗网络模型的各层网络的参数,持续输入训练样本,并根据损失函数计算出条件生成对抗网络模型的损失值;

通过反向传播算法计算出各层网络的参数的梯度,并通过随机梯度下降优化算法优化各层网络的参数。

为了便于理解,请参见图15,为本申请提供的一种局部放电信号的模式识别装置的结构示意图。

本申请第二方面提供了一种局部放电信号的模式识别装置,包括:

获取数据集模块10,用于获取局部放电数据,对局部放电数据进行预处理,以预处理后的数据作为训练条件生成对抗网络的数据集,并将数据集分为训练数据集和测试数据集;

生成模块20,用于根据训练目标构造条件生成对抗网络模型和机器学习分类器;

训练模块30,用于在训练数据集中,训练条件生成对抗网络模型;

获取新数据集模块40,用于将随机噪声信号输入条件生成对抗网络模型的生成器,以使生成器生成新的局部放电数据,根据新的局部放电数据获得新的数据集;

验证模块50,用于在新的数据集中训练机器学习分类器后,在测试数据集中验证机器学习分类器的准确率。

可选地,生成数据集模块10还用于通过高电压试验系统配合多种局部放电试验模型进行信号实验,并获取局部放电数据。

本申请第三方面提供了一种局部放电信号的模式识别设备,设备包括处理器以及存储器:

存储器用于存储程序代码,并将程序代码传输给处理器;

处理器用于根据程序代码中的指令执行上述实施例的局部放电信号的模式识别方法。

本申请第四方面提供了一种计算机可读存储介质,计算机可读存储介质用于存储程序代码,程序代码用于执行上述实施例的局部放电信号的模式识别方法。

本申请的说明书及上述附图中的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

应当理解,在本申请中,“至少一个(项)”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系,例如,“a和/或b”可以表示:只存在a,只存在b以及同时存在a和b三种情况,其中a,b可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b或c中的至少一项(个),可以表示:a,b,c,“a和b”,“a和c”,“b和c”,或“a和b和c”,其中a,b,c可以是单个,也可以是多个。

在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(英文全称:read-onlymemory,英文缩写:rom)、随机存取存储器(英文全称:randomaccessmemory,英文缩写:ram)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1