基于改进GAN算法的电缆故障特征提取方法、设备及介质与流程

文档序号：40726420发布日期：2025-01-17 12:54阅读：93来源：国知局

本发明属于电缆故障诊断领域，涉及电缆故障诊断中的故障特征提取技术，特别涉及一种基于改进生成对抗网络(generative adversarial network，gan)算法的电缆故障特征提取方法、设备及介质。

背景技术：

1、随着电网规模的不断扩大，电缆作为电能传输的重要载体，使用量逐渐增加。电缆通常埋设于地下，运行环境较为恶劣，投入运行后期容易因局部绝缘劣化导致早期故障，早期故障反复发生后会演变发展为永久性故障。早期故障发生于故障初期，持续时间短，不易检测，但是电网监测系统中实时记录的电压电流数据可以反映电缆运行状态。根据电压电流变化与电缆状态的对应关系，建立精确的数学模型实现电缆早期故障的辨识，有利于工作人员在电缆发生永久性故障前及时维修或更换电缆，保障电力系统稳定可靠运行。

2、近年来，随着深度学习技术的兴起，基于数据驱动的智能故障诊断技术在各领域得到了广泛的研究和应用。然而，多数现有研究在真正应用于电缆故障诊断时未能达到理想的性能水平。最重要的原因在于，确保智能诊断模型有效的前提是需要训练集具备充足的故障样本。然而，在实际生产过程中，出于安全等方面的考虑，电缆无法持续运行在故障状态，导致收集到的监测数据中故障样本极为稀缺，且涵盖的类别有限。因此，实际可获得的训练数据集通常呈现出类分布偏斜特性。

3、数据增强方法为解决不平衡问题提供了简单但有效的思路：基于已有的真实数据集，合成新样本或删除原有样本，令原本不平衡的数据集趋于平衡化，从而消除不平衡数据集给诊断模型训练带来的负面影响。其中，基于深度生成模型的数据增强方法，如gan及其变体，在学习复杂高维数据分布方面表现出了极其优越的性能，为解决故障诊断领域的不平衡问题提供了一个新视角。

4、相关文献：

5、《不平衡_小样本场景下的天然气管道智能诊断研究_王闯》

6、《基于主成分分析与增量卷积神经网络的电缆早期故障辨识研究_陶云春》

7、《基于cnn-lstm的输电线路故障诊断方法研究_冯寅》

技术实现思路

1、本发明的目的，在于提供一种基于改进gan算法的电缆故障特征提取方法、设备及介质，能够解决现有电缆故障诊断中存在的样本数目不平衡问题。

2、为了达成上述目的，本发明的解决方案是：

3、一种基于改进gan算法的电缆故障特征提取方法，包括如下步骤：

4、步骤a，采集电缆三相电流iabc及对应的时间t、状态信息y，对三相电流iabc进行处理得到样本电流x；

5、步骤b，计算样本电流x的排列熵和近似熵，并基于所述排列熵和近似熵构建得到潜在变量q(t)，作为训练生成器的输入；

6、步骤c，将潜在变量q(t)导入训练生成器g中，获取合成数据g{q(t)}；

7、步骤d，将真实数据x与合成数据g{q(t)}导入训练判别器j中进行判别，并根据判别结果对训练判别器j和训练生成器g的网络参数θj、θg进行修正；

8、步骤e，重复步骤c-d，直至判别器无法区分合成数据和真实数据时终止迭代，输出等数量不同状态下的样本数据集；

9、步骤f，提取电缆三相电流在健康及故障工况下的时域、频域和时频域下的特征值，建立特征矩阵a。

10、上述步骤a中，状态信息y中包括如下状态，

11、状态1：a相接地故障

12、状态2：b相接地故障

13、状态3：c相接地故障

14、状态4：ab两相接地故障

15、状态5：bc两相接地故障

16、状态6：ac两相接地故障

17、状态7：三相接地故障

18、状态8：正常状态

19、状态9：电弧故障。

20、上述步骤a中，对三相电流iabc进行处理得到样本电流x的公式是，

21、

22、式中，xmin为三相电流iabc的最小幅值；xmax为三相电流iabc的最大幅值。

23、上述步骤b中，计算样本电流x的排列熵的方法是，

24、设定时间序列数据集其中表示在t时刻第i个真实样本，i＝1,…,nt，nt为真实样本的数量，包含n个采样点的样本电流；以长度l的滑动窗口计算每个样本的排列熵，l≤n，在滑动窗口内重构的相空间，描述为：

25、

26、式中，m是嵌入维度，τ是时间延迟，m＝l-(m-1)τ是重构像空间的向量数；将重构矩阵的第j行按照升序排列，形成一个新的序列，表示为：

27、

28、式中，a1表示重构矩阵第j行中最小值的索引，am表示重构矩阵第j行中最大值的索引；由此组成的序列有m！种排列可能性；则排列熵表示为：

29、

30、式中，pa表示符号的概率分布，k≤m！。

31、上述步骤b中，计算样本电流x的近似熵的方法是，

32、设时间序列zn＝{z1,z2,…zn}长度为n，将序列进行m维相空间重构，m>2，得到序列：zm(i)＝{z(k),z(k+1),…,z(k+m-1)},k＝1,2,…,n-m+1；两维之间的距离为：

33、d＝max|zm(k)-zm(j)|,j≠k,k≤j≤n-m

34、其中max为两维时间序列对应元素最大差值，定义相似容限r＝0.2*std，std为zn标准差；统计满足距离小于相似容限r的个数为num与总矢量的比值：

35、

36、对上述比值求对数，并求出m为向量的每个k平均值，公式为：

37、

38、改变相空间重构维数m＝m+1，重复以上步骤得到通过计算得到近似熵为：

39、

40、上述步骤b中，根据以下公式基于所述排列熵和近似熵构建得到潜在变量q(t)，

41、

42、式中，iter为当前迭代次数，itermax为最大迭代次数，y为当前状态。

43、上述步骤c中，训练生成器g的损失函数为，

44、

45、式中，g和j分别为训练生成器和训练判别器，q代表潜在变量q(t)，pq(q)为潜在变量的概率分别；j(·)为训练判别器的输入是真实数据而非合成数据的概率。

46、上述步骤d中，训练判别器j的损失函数为，

47、

48、式中，xˊ表示真实数据，px(x)为真实数据的分布。

49、上述步骤d中，根据判别结果对训练判别器j和训练生成器g的网络参数θj、θg进行修正，其中，对训练判别器j的网络参数θj进行修正的公式是，

50、θj＝1+αj(g(q))

51、对训练生成器g的网络参数θg进行修正的公式是，

52、θg＝1-αj(g(q))

53、式中，α为常数；q代表潜在变量q(t)，j(·)为判别器的输入是真实数据而非合成数据的概率。

54、上述步骤e中，判别器无法区分合成数据和真实数据的必要条件为j(g(q))≈1。

55、上述步骤f中，特征矩阵a中的时域特征包括最大值、最小值、标准差、均方根值和峭度，频域特征包括重心频率、平均频率、均方根频率和频率标准差，时频域特征包括奇异熵、近似熵和模糊熵。

56、一种基于改进gan算法的电缆故障特征提取设备，包括存储器、处理器，以及存储在所述存储器中并可在所述处理器上运行的计算机程序；所述处理器执行所述计算机程序时实现如前所述的基于改进gan算法的电缆故障特征提取方法的步骤。

57、一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序；所述计算机程序被处理器执行时实现如前所述的基于改进gan算法的电缆故障特征提取方法的步骤。

58、采用上述方案后，本发明为解决电缆故障诊断中存在的样本数目不平衡问题提供了解决方法：一方面，本发明对电缆故障相电流进行了归一化处理，使得在应对不同的故障样本数据集时具备普适性；另一方面，本发明对gan网络中的训练生成器进行了改进，融合了排列熵和近似熵作为训练生成器的潜在变量的组成，可以更有效地表征数据的时间相关性，可以捕捉更多的类别之间的内在联系。此外，在潜在变量构成中，通过考虑迭代次数的影响，使one-hot向量随着迭代次数的增加比例逐渐增大，可以更好地捕捉时间序列的上下文信息，逐渐减少潜在类别信息的不确定性。本发明极大提升了合成数据的稳定性和准确性，加速了样本扩充流程，为故障特征的提取提供了便利。

当前第1页1 2

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李志超,陈俊儒,张昆,毛健,童志祥,陈祎璠,罗金文,黄泰山,孙远刚,徐天乐,余松
技术所有人：三峡金沙江云川水电开发有限公司
我是此专利的发明人

该领域下的技术专家

1、邢老师：1.机械设计及理论 2.生物医学材料及器械 3.声发射检测技术。

2、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究

3、王老师：1.机器人 2.嵌入式控制系统开发

4、张老师：1.机械设计的应力分析、强度校核的计算机仿真 2.生物反应器研制 3.生物力学

5、赵老师：检测与控制技术、机器人技术、机电一体化技术

网友询问留言留言:0条

还没有人留言评论。精彩留言会获得点赞！

文明留言，给您点赞！