一种双生成对抗网络的宽频振荡数据集增强方法

文档序号:33365988发布日期:2023-03-07 22:42阅读:54来源:国知局
一种双生成对抗网络的宽频振荡数据集增强方法

1.本发明涉及宽频振荡扰动源定位技术领域,尤其涉及一种双生成对抗网络的宽频振荡数据集增强方法。


背景技术:

2.在现代“双高”电力系统中,由大量电力电子设备与电网之间相互作用引起的宽频振荡已经成为影响电网安全稳定运行的重要问题,严重威胁到电网的安全稳定。因此,为了在宽频振荡发生后及时采取抑制措施保证电力系统安全稳定运行,需要实现宽频振荡扰动源的准确定位。
3.目前,传统的振荡定位方法,如能量法,行波检测法等均通过分析振荡发生内在机理建立系统数学模型,再根据系统实时量测数据计算相关指标实现振荡源定位,具有较强的解释性。但此类方法均依赖于一定的物理假设与简化条件,在电力系统不满足这些前提时,适用效果较差。近年来,有研究将以人工智能为代表的数据驱动方法应用于振荡定位,此类定位方法摆脱了对系统数学模型的依赖,具有较强的非线性分析能力与宽适用性。
4.然而,考虑到电力系统量测数据存在的噪声污染与数据攻击导致数据质量降低,同时受限于当前电力系统中宽频振荡量测装置的安装量,实际量测获取的宽频振荡样本数量缺乏,难以构建具有强鲁棒性的基于人工智能的宽频振荡扰动源定位模型,从而降低了定位的准确性。


技术实现要素:

5.本发明的目的在于提供一种双生成对抗网络的宽频振荡数据集增强方法,旨在解决实际量测获取的宽频振荡样本数量缺乏,难以构建宽频振荡扰动源定位模型的问题。
6.为实现上述目的,本发明提供了一种双生成对抗网络的宽频振荡数据集增强方法,包括以下步骤:
7.通过生成对抗插补网络对宽频振荡样本进行插补修复,得到修复数据集;
8.通过条件生成对抗网络对所述修复数据进行定向扩增,得到扩增数据集;
9.通过生成对抗插补网络对所述扩增数据集进行质量增强,得到增强数据集。
10.其中,在步骤通过生成对抗插补网络对所述扩增数据集进行质量增强,得到增强数据集之后,所述方法还包括:
11.使用多种评价指标对所述增强数据集进行评价,得到数据增强效果。
12.其中,所述通过生成对抗插补网络对宽频振荡样本进行插补修复,得到修复数据集,包括:
13.根据宽频振荡样本的数据矩阵中各元素对应位置缺失情况,构造掩码矩阵和噪声矩阵;
14.将所述数据矩阵、所述噪声矩阵和所述掩码矩阵输入生成对抗插补网络,输出预测掩码矩阵。
15.其中,所述生成对抗插补网络包括生成器和判别器。
16.其中,所述将所述数据矩阵、所述噪声矩阵和所述掩码矩阵输入生成对抗插补网络,输出预测掩码矩阵,包括:
17.生成器基于所述数据矩阵和所述噪声矩阵生成插补矩阵;
18.判别器基于所述掩码矩阵结合提示矩阵区分所述插补矩阵中各元素是否为所述数据矩阵中的真实元素。
19.其中,所述多种评价指标包括均方根误差、均方误差、最大均值差异、wasserstein距离和定位准确率。
20.本发明的一种双生成对抗网络的宽频振荡数据集增强方法,通过生成对抗插补网络对宽频振荡样本进行插补修复,得到修复数据集;通过条件生成对抗网络对所述修复数据进行定向扩增,得到扩增数据集;通过生成对抗插补网络对所述扩增数据集进行质量增强,得到增强数据集。基于双生成对抗网络的协同工作使残缺的量测样本集特征与完整的生成样本集特征相融合,提高定向生成样本的质量,实现宽频振荡数据集增强。解决了实际量测获取的宽频振荡样本数量缺乏,难以构建宽频振荡扰动源定位模型的问题。
附图说明
21.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
22.图1是基于cgan-gain的宽频振荡数据集增强框架的示意图。
23.图2是条件生成对抗网络的结构的示意图。
24.图3是生成对抗式插补网络的结构的示意图。
25.图4是生成对抗插补网络的判别器网络结构的示意图。
26.图5是生成对抗插补网络的生成器网络结构的示意图。
27.图6是条件生成对抗网络的判别器网络结构的示意图。
28.图7是条件生成对抗网络的生成器网络结构的示意图。
29.图8是宽频振荡定位模型网络结构的示意图。
30.图9是不同数据生成方法比较结果图。
31.图10是本发明提供的一种双生成对抗网络的宽频振荡数据集增强方法的流程图。
具体实施方式
32.下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
33.请参阅图1至图10,本发明提供一种双生成对抗网络的宽频振荡数据集增强方法,包括以下步骤:
34.s1通过生成对抗插补网络对宽频振荡样本进行插补修复,得到修复数据集;
35.具体方式为:
36.s11根据宽频振荡样本的数据矩阵中各元素对应位置缺失情况,构造掩码矩阵和噪声矩阵;
37.具体的,对于实际电力系统量测得到的,由于数据攻击、测量设备损坏与传输信号干扰等问题而存在数据丢失的宽频振荡样本,生成对抗插补网络(gain)将其作为模型输入,输出插补后的完整数据。在训练过程中,首先根据宽频振荡样本数据矩阵中各元素对应位置缺失情况,构造掩码矩阵和噪声矩阵。
38.s12将所述数据矩阵、所述噪声矩阵和所述掩码矩阵输入生成对抗插补网络,输出预测掩码矩阵。
39.具体的,所述生成对抗插补网络包括生成器和判别器。
40.所述将所述数据矩阵、所述噪声矩阵和所述掩码矩阵输入生成对抗插补网络,输出预测掩码矩阵,包括:
41.s121生成器基于所述数据矩阵和所述噪声矩阵生成插补矩阵;
42.s122判别器基于所述掩码矩阵结合提示矩阵区分所述插补矩阵中各元素是否为所述数据矩阵中的真实元素。
43.具体的,将数据矩阵、噪声矩阵和掩码矩阵输入gain,生成器g生成插补矩阵逼近数据矩阵,判别器d结合提示矩阵区分所述插补矩阵中各元素是否为所述数据矩阵中的真实元素,输出预测掩码矩阵。通过对抗训练,g能学习到数据矩阵中真实元素的分布,目标函数为:
[0044][0045]
式中:m为一个取值为[0,1]的矩阵,称作掩码矩阵,0表示该处元素缺失,1表示该处元素未缺失;为经g插补后的矩阵;h是由提示生成器生成的提示矩阵,其为判别器提供了缺失数据的部分信息,有助于强化g和d的对抗博弈过程。
[0046]
其中,本发明创新在于经gain修复后的宽频振荡样本能够避免关键潜在特征被破坏,保证原始数据能被充分利用,提高数据集质量。
[0047]
s2通过条件生成对抗网络对所述修复数据进行定向扩增,得到扩增数据集;
[0048]
具体的,基于条件生成对抗网络(cgan)实现宽频振荡样本定向扩增。其中,cgan技术是一种改进的生成对抗网络,它的生成器g和判别器d带有额外的标签信息作为约束条件,能够通过相互对抗博弈,逼近宽频振荡原始数据特征分布,实现宽频振荡样本定向扩增,其目标函数为:
[0049][0050]
式中:z为随机噪声向量;x是真实样本;y是标签信息;g(z)是生成样本;d(
·
)是判别器的判别结果。z和y通常以相乘或连接方式组成联合隐层表征。
[0051]
其中,本方案创新在于考虑到实际系统中宽频振荡量测样本较少,利用cgan能学习到满足指定起振源条件的噪声分布与实际振荡信号之间的映射关系的优势,定向生成以
指定机组作为起振源的宽频振荡样本,扩大宽频振荡样本集。
[0052]
s3通过生成对抗插补网络对所述扩增数据集进行质量增强,得到增强数据集。
[0053]
具体的,采用s1中的gain对生成样本进行质量增强。基于s1中训练好的gain的生成器在训练过程中学习到的完整宽频振荡潜在特征分布,增强s2中生成的所述扩增数据集。
[0054]
s4使用多种评价指标对所述增强数据集进行评价,得到数据增强效果。
[0055]
具体的,所述多种评价指标包括均方根误差、均方误差、最大均值差异、wasserstein距离和定位准确率。
[0056]
选择均方根误差、均方误差、最大均值差异和wasserstein距离作为质量评价指标,同时考虑基于人工智能的宽频振荡定位模型在数据集增强后的定位准确率,综合评价cgan-gain双生成对抗网络的宽频振荡数据集增强效果。
[0057]
其中,本发明的创新在于综合考虑不同类型的评价指标,全面客观的说明宽频振荡数据集增强效果。
[0058]
下面结合附图,对本发明实施例中的技术方案进行说明。
[0059]
对于实际电力系统量测得到的,由于环境干扰或传输时延等问题产生数据丢失的宽频振荡样本,采用生成对抗插补网络(generative adversarial imputation network,gain)进行数据修复。gain是一种无监督学习模型,无需完整数据集训练即可修复数据。其目标函数如下:
[0060][0061]
式中:m为一个取值为[0,1]的矩阵,称作掩码矩阵,0表示该处元素缺失,1表示该处元素未缺失;为经g插补后的矩阵;h是由提示生成器生成的提示矩阵,其为判别器提供了缺失数据的部分信息,有助于强化g和d的对抗博弈过程。
[0062]
本发明中使用的生成对抗插补网络的判别器与生成器网络结构如图4、5所示。
[0063]
为进一步验证本发明中所使用的gain相较于传统数据修复方法的创新与优势,设置与其他数据修复方法的对比实验,包括k临近算法(k nearest neighbors,knn)、均值插补法、链式方程的多重插补法(multivariate imputation by chained equations,mice)。以均方根误差(root mean square error,rmse)、均方误差(mean square error,mse)与最大均值差异(maximum mean discrepancy,mmd)作为修复效果评价指标。
[0064][0065][0066]
[0067]
式中:n,m代表两个分布各自的样本总数;xi,yi分别为无损失干扰的原始宽频振荡数据与经过修复后的带损失干扰数据,其空间分布为x和y;映射函数φ():xh表示从原始空间到希尔伯特空间的一个映射。通过计算mmd可以反映两个不同分布之间的差异大小。
[0068]
考虑到实际系统中宽频振荡样本缺乏,无法建立强鲁棒性的模型,因此采用cgan定向扩增宽频振荡数据集。以完整的宽频振荡样本构建训练集,将起振机组编号与振荡时序信号作为条件与真实样本输入cgan进行训练。训练结束后,cgan的生成器能学习到满足指定起振源条件的噪声分布与实际振荡信号之间的映射关系,从而定向生成以指定机组作为起振源的宽频振荡样本。cgan的目标函数如下:
[0069][0070]
然而,受限于宽频振荡样本本身的复杂性与gan训练的不稳定性等问题,cgan无法达到纳什均衡,只能获得一个局部最优解,因此生成样本的质量仍有待增强。因此,本发明采用已经训练好的gain对生成样本进行质量增强。将生成样本随机丢失20%数据后使用训练好的gain修复补全,重复10次并对修复结果加和求平均,最终得到由gain增强后的宽频振荡样本。通过gain,生成样本能在保持自身分布特征不被破坏的前提下,充分挖掘利用原始数据中的部分关键潜在特征,进而实现样本质量增强。
[0071]
本发明中使用的条件生成对抗网络的判别器与生成器网络结构如图6、7所示。
[0072]
为进一步验证数据质量增强效果,同时对比不同方法生成样本质量,选择ros、smote与cgan方法作为实验对照组。以生成样本与原始仿真样本的rmse、mse、mmd、wasserstein距离以及生成样本用于宽频振荡定位模型训练集增强后的准确率作为评价指标。wasserstein距离表达式如下:
[0073][0074]
式中:π
(p,q)
表示分布p和q组合起来的所有可能的联合分布的集合;inf指代最大下界。对于每一个可能的联合分布γ可以从中采样(x,y)~γ得到一个样本x与y,并计算出这对样本的距离||x-y||,因此可得到在联合分布γ下样本对距离的期望值。在所有可能的联合分布中该期望值能取到的下界即wasserstein距离,它能用以衡量两个不同分布之间的距离。
[0075]
本发明中使用的宽频振荡定位模型网络结构如图8所示。
[0076]
通过上述方法,可以完整、全面的评估基于cgan-gain双生成对抗网络的宽频振荡数据集增强效果。
[0077]
如图9所示,由于ros和smote法均基于过采样方法生成样本,数据质量较低,在各项指标上表现较差。cgan通过对抗训练能够逼近原始数据分布,能够构建较高质量的宽频振荡数据集,生成样本分布与原始数据分布差异较小,各项指标较过采样类方法有一定的进步。而本发明提出的基于cgan-gain双生成对抗网络的数据生成方法在cgan的基础上通过引入gain进一步解决了输入的系统量测数据因为带缺失而无法利用以及生成样本数据质量欠佳的问题,相比于传统生成方法在各项评价指标上表现较好,生成样本分布与原始
样本分布差异较小,验证了所提方法应用于宽频振荡数据集增强的有效性与可靠性。
[0078]
综上所述,与现有技术相比,本发明所具有的有益效果为:
[0079]
1、通过gain无需完整数据集训练即可高精度修复带缺失的系统量测数据,恢复原始数据的潜在特征分布;
[0080]
2、基于cgan定向生成由不同机组作为起振源的振荡样本,有效扩增了宽频振荡样本数量;
[0081]
3、基于cgan-gain双生成对抗网络的协同工作使残缺的量测样本集特征与完整的生成样本集特征相融合,提高定向生成样本的质量,实现宽频振荡数据集增强。
[0082]
以上所揭露的仅为本发明一种双生成对抗网络的宽频振荡数据集增强方法较佳实施例而已,当然不能以此来限定本发明之权利范围,本领域普通技术人员可以理解实现上述实施例的全部或部分流程,并依本发明权利要求所作的等同变化,仍属于发明所涵盖的范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1