本技术涉及电网,尤其涉及时序电力数据异常检测模型训练方法、系统和存储介质。
背景技术:
1、随着电力系统的现代化和智能化,大量的传感器和监控设备被部署在各个关键节点,如变压器、发电机、输电线路等,实时收集电流、电压、功率等时序电力数据。这些数据为电力系统的稳定运行、故障预测和能源优化提供了宝贵的信息。然而,由于各种原因,如设备故障、外部干扰、通信错误等,收集到的电力数据中可能存在噪声或异常值。
2、传统的时序数据异常检测方法主要基于统计学和预设约束。例如,一些方法使用滑动窗口计算数据的均值和标准差,然后根据这些统计量判断数据是否为异常。另一些方法则基于领域知识设置数据的上下界,超出这些界限的数据被认为是异常。然而,现有方法存在以下问题:
3、1).样本不均衡问题:在实际应用中,异常数据的数量通常远远小于正常数据的数量。传统方法往往需要大量的异常样本来建立有效的模型,但在实际情况中,获取这么多的异常样本是不现实的。
4、2).无法捕获复杂的数据模式:时序电力数据中的异常可能是由多种因素引起的,这些因素之间可能存在复杂的非线性关系。传统的基于统计或约束的方法很难捕获这些复杂的模式。
5、3).高误报率:由于传统方法通常基于简单的统计量或预设约束,它们可能会将一些实际上是正常的数据误判为异常,导致高误报率。
6、4).打标工作量大:传统方法获取大量正常和异常训练样本,需要逐一识别类别并打标,实际应用难度大。
7、5).训练效率低:面对大量复杂的时序电力数据,异常检测模型需要从初始状态开始训练,训练速度慢,分类性能低。
技术实现思路
1、针对现有技术的不足,本技术提出了一种时序电力数据异常检测模型训练方法、系统和存储介质,解决了现有时序电力数据异常检测样本不均衡、无法捕获复杂的数据模式、高误报率、打标工作量大和训练效率低的问题。
2、为了实现上述目的,本技术技术方案如下:
3、一种时序电力数据异常检测模型训练方法,包括以下步骤s1-s9:
4、s1、获取第一时序正常电力数据样本。
5、第一时序正常电力数据样本为时序正常电力数据样本集合中的任一时序正常电力数据样本。
6、s2、将第一时序正常电力数据样本构建成第一张量集样本。
7、s3、从预设的随机噪声向量集合中获取第一随机噪声向量。
8、第一随机噪声向量为随机噪声向量集合中的任一随机噪声向量。
9、s4、将第一随机噪声向量输入至待训练gan模型的生成器中,通过生成器采用非线性变化将第一随机噪声向量映射成与第一张量集样本具有相同数据分布特征的第一伪造向量集样本。
10、s5、将第一张量集样本和第一伪造向量集样本输入至待训练gan模型的判别器中,通过判别器分别对第一张量集样本和第一伪造向量集样本进行真伪判别,并输出第一真伪判别结果。
11、s6、根据第一真伪判别结果的误差,反向传播更新生成器和判别器的神经网络参数。最终,根据每个真伪判别结果的误差,反向传播更新生成器和判别器的神经网络参数,直至待训练gan模型的目标函数达到最优值,得到gan模型。
12、s7、通过gan模型的生成器将若干随机噪声映射成若干时序异常电力数据样本,得到时序异常电力数据样本集合。
13、s8、将时序正常电力数据样本集合中的各时序正常电力数据样本标记为正常数据,将时序异常电力数据样本集合的各时序异常电力数据样本标记为异常数据,构成分类训练样本集合。
14、s9、以gan模型的判别器作为初始化模型,以分类训练样本集合中的各分类训练样本为输入,以分类训练样本对应的标记为输出参考,对初始化模型进行训练,直至初始化模型的损失函数收敛,得到电力数据异常检测模型。
15、可选地,步骤s2包括以下步骤s21-s22:
16、s21、对第一时序正常电力数据样本进行归一化处理。
17、s22、将归一化的第一时序正常电力数据样本的每个时刻的电力数据构建成一维向量,并按时间顺序排列每个一维向量,得到第一张量集样本。
18、可选地,步骤s21包括以下步骤s211-s213:
19、s211、获取第一时序正常电力数据样本的第一特征及对应的第一特征值。第一特征为第一时序正常电力数据样本中任一时刻的数据特征。
20、s212、确定时序正常电力数据样本集合中的第一特征的最小值和最大值。
21、s213、利用所述第一特征值、所述最小值和所述最大值,求得第一时序正常电力数据样本的第一特征的归一化数值。最终,求得第一时序正常电力数据样本中每个时刻的数据特征的归一化数值。
22、可选地,归一化数值的表达式为:
23、x*=(x0-xmin)/(xmax-xmin)
24、x*表示归一化数值,xmin表示所述最小值,xmax表示所述最大值,x0表示所述第一特征值。
25、可选地,待训练gan模型的目标函数的表达式为:
26、
27、其中,d为判别器,g为生成器,x为张量集样本,z为随机噪声向量,e指代取期望,是由判别器d辨别出张量集样本x属于真实数据的对数损失函数构建而成,ez~pz(z)[log(1-d(g(z)))]由生成器g的对数损失函数构建而成。
28、可选地,第一时序正常电力数据样本包括电压特征、电流特征和功率特征。
29、可选地,在步骤s3之前,还包括以下步骤:通过xavier处理器初始化代训练gan模型的神经网络参数。
30、基于相同的技术构思,本技术还提供了一种(名词+动词/动词+名词)系统,包括:
31、获取模块,用于获取第一时序正常电力数据样本;第一时序正常电力数据样本为时序正常电力数据样本集合中的任一时序正常电力数据样本。
32、处理模块,用于将第一时序正常电力数据样本构建成第一张量集样本;
33、从预设的随机噪声向量集合中获取第一随机噪声向量;
34、第一随机噪声向量为随机噪声向量集合中的任一随机噪声向量;
35、将第一随机噪声向量输入至待训练gan模型的生成器中,通过生成器采用非线性变化将第一随机噪声向量映射成与第一张量集样本具有相同数据分布特征的第一伪造向量集样本;
36、将第一张量集样本和第一伪造向量集样本输入至待训练gan模型的判别器中,通过判别器分别对第一张量集样本和第一伪造向量集样本进行真伪判别,并输出第一真伪判别结果;
37、根据第一真伪判别结果的误差,反向传播更新生成器和判别器的神经网络参数。最终,根据每个真伪判别结果的误差,反向传播更新生成器和判别器的神经网络参数,直至待训练gan模型的目标函数达到最优值,得到gan模型;
38、通过gan模型的生成器将若干随机噪声映射成若干时序异常电力数据样本,得到时序异常电力数据样本集合;
39、将时序正常电力数据样本集合中的各时序正常电力数据样本标记为正常数据,将时序异常电力数据样本集合的各时序异常电力数据样本标记为异常数据,构成分类训练样本集合;
40、以gan模型的判别器作为初始化模型,以分类训练样本集合中的各分类训练样本为输入,以分类训练样本对应的标记为输出参考,对初始化模型进行训练,直至初始化模型的损失函数收敛,得到电力数据异常检测模型。
41、可选地,处理模块还用于对第一时序正常电力数据样本进行归一化处理;将归一化的第一时序正常电力数据样本的每个时刻的电力数据构建成一维向量,并按时间顺序排列每个一维向量,得到第一张量集样本。
42、基于相同的技术构思,本技术还提供了一种时序电力数据异常检测模型训练存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行上述任一所述的时序电力数据异常检测模型训练方法中的步骤。
43、本技术的有益效果:
44、(1)通过gan网络对抗生成的生成器,能够随机生成带噪声的训练样本,作为潜在的异常数据,从而避免了对大量异常样本的依赖,有效地解决了训练样本不均衡问题。
45、(2)通过gan网络对抗生成的判别器,可以学习判断异常样本与真实样本之间的差异,从而准确地识别异常,显著降低误报率。
46、(3)gan对抗网络能够学习和模拟时序电力数据的真实分布,能够捕获时序电力数据中的复杂模式,从而准确地检测出由多种因素引起的异常。
47、(4)采集真实的正常电力数据样本,并用生成器将随机噪声映射成逼真的异常电力数据样本,无需给定大量的标注数据,实现无监督的时序数据异常检测,大大简化了模型的部署和应用,降低了实际应用中的成本和难度。
48、(5)用训练好的gan模型的判别器作为电力数据异常检测模型训练用的初始化模型,分类模型能够从先前训练好的gan模型中获取一些先验知识或已学到的表示,这种启动时的先验知识可以帮助分类模型在开始训练时更快地收敛,提高分类性能。