本发明涉及用电负荷数据生成领域,特别涉及一种基于条件去噪扩散模型的用电负荷分解数据生成方法及装置。
背景技术:
1、用电负荷分解技术仅使用建筑物的主线路电表来实现对建筑物内的各个用电设备及其工作状态的辨识,它能够广泛的应用于建筑节能,智慧城市,智能电网等领域。目前这项技术都是使用大量标记的电器设备数据进行训练的。但是此类数据的收集具有挑战性,这使得数据成为创建通用化的非侵入式用电负荷监测解决方案的主要瓶颈。
2、目前存在一些公共数据集,这些数据集涵盖了电器设备的能源消耗信息。它们旨在通过使用低频或高频的侵入性监测设备来度量家庭电器设备的能耗。通过对家庭能源需求进行持续监测,这些数据集提供了全面而长期的测量结果,以便研究居民住宅中的用户行为。这些数据集对于执行用电负荷分解任务非常有用,因为它们在设备级别上提供了详细的用电负荷监控数据。然而,目前可用的公共数据集规模相对有限。为了缓解数据限制,需要一种生成居民建筑用电负荷监控数据的方法。目前的基于生成对抗模型的数据生成算法存在一些问题,例如模式崩溃,导致生成的样本缺乏多样性,并且它们往往忽略了日期时间信息与用电负荷数据之间的强相关性。
技术实现思路
1、为了解决上述问题,本发明实施例提供一种基于条件去噪扩散模型的用电负荷分解数据生成方法。
2、第一方面,本发明实施例包括一种基于条件去噪扩散模型的用电负荷分解数据生成方法,包括获取原始用电负荷数据,其中,所述原始用电负荷数据包括日期时间数据;s2、对所述原始用电负荷数据进行预处理,得到处理后数据;s3、对所述日期时间数据进行编码,得到日期编码数据;s4、构建条件去噪扩散模型,利用所述处理后数据和所述日期编码数据对所述条件去噪扩散模型进行训练,得到训练后条件去噪扩散模型;s5、利用所述训练后条件去噪扩散模型对所述原始用电负荷数据进行随机重采样,得到仿真数据。
3、可选的,所述s2包括:
4、s21、对所述原始用电负荷数据进行重采样;
5、s22、填充所述原始用电负荷数据的缺失值;
6、s23、基于所述原始用电负荷数据生成用电负荷曲线,对所述用电负荷曲线进行归一化来调整数据跨度。
7、可选的,所述s3包括:
8、s31、基于所述日期时间数据,从时间标签中提取时间特征;
9、s32、利用所述时间特征集成多尺度时间信息,其中,月数据利用独热向量格式进行编码,天数据利用余弦周期性特征进行编码。
10、可选的,所述条件去噪扩散模型包括前向过程和后向过程,所述前向过程包括前向加噪阶段和前向扩散阶段,其中,在所述前向扩散阶段中,所述处理后数据经过添加高斯噪声得到的满足高斯分布的完全随机噪声可以表示为:
11、
12、
13、
14、αt=1-βt
15、其中x0为处理后数据,βt为预先定义的schedule[β1,β2,…,βt]中的单元,εt为标准正态分布中采样得到的高斯噪音。
16、可选的,所述条件去噪扩散模型的后向过程包括:
17、后向去噪阶段,对所述完全随机噪声逐步去除噪声并进行数据重建,其中计算条件概率公式为:
18、
19、式中,为条件概率的均值,为条件概率的方差。
20、可选的,所述后向去噪阶段中使用预测噪声模型,包括:
21、s41、利用4层卷积层进行下采样,每层将特征维度减小一半;
22、s42、利用4层反卷积层进行特征信息的上采样,每层放大特征维度并与对应收缩路径的特征图进行拼接;
23、s43、通过残差结构完成网络的传递和通道数量的扩充缩减;
24、s44、利用最后一层卷积层调整输出的数据维度与输入相同,得到噪音的预测值。
25、可选的,所述预测噪声模型还包括:
26、在各个连接层之间添加交叉注意力层,公式为:
27、
28、
29、
30、
31、式中,代表神经网络中可学习的权重矩阵,φi(xt)代表输入xt经过第i层网络结构时的中间向量,ψ(y)定义对条件信息的编码,d为输入向量的维度。
32、第二方面,本发明实施例还包括一种基于条件去噪扩散模型的用电负荷分解数据生成装置,包括数据获取模块,获取原始用电负荷数据,其中,所述原始用电负荷数据包括日期时间数据;
33、预处理模块,对所述原始用电负荷数据进行预处理,得到处理后数据;
34、日期编码模块,对所述日期时间数据进行编码,得到日期编码数据;
35、模型训练模块,构建条件去噪扩散模型,利用所述处理后数据和所述日期编码数据对所述条件去噪扩散模型进行训练,得到训练后条件去噪扩散模型;
36、仿真模块,利用所述训练后条件去噪扩散模型对所述原始用电负荷数据进行随机重采样,得到仿真数据。
37、可选的,所述预处理模块包括:
38、重采样模块,对所述原始用电负荷数据进行重采样;
39、数据填充模块,填充所述原始用电负荷数据的缺失值;
40、归一化模块,基于所述原始用电负荷数据生成用电负荷曲线,对所述用电负荷曲线进行归一化来调整数据跨度。
41、可选的,所述日期编码模块包括:
42、特征提取模块,基于所述日期时间数据,从时间标签中提取时间特征;
43、编码模块,利用所述时间特征集成多尺度时间信息,其中,月数据利用独热向量格式进行编码,天数据利用余弦周期性特征进行编码。
44、本发明实施例包括以下优点:
45、本发明通过设计条件去噪扩散模型,从现存数据中挖掘现有居民用电特征,训练生成式模型生成用电负荷数据。并且由于数据生成以日期时间编码作为条件信息,生成的数据表现出和日期的强相关性,更符合用户的用电习惯。有助于下游的用电负荷分解任务、居民用电模式识别、建立虚拟电厂等工作。
1.一种用电负荷分解数据生成方法,其特征在于,包括:
2.根据权利要求1所述的基于条件去噪扩散模型的用电负荷分解数据生成方法,其特征在于,所述s2包括:
3.根据权利要求2所述的基于条件去噪扩散模型的用电负荷分解数据生成方法,其特征在于,所述s3包括:
4.根据权利要求1所述的基于条件去噪扩散模型的用电负荷分解数据生成方法,其特征在于,所述条件去噪扩散模型包括前向过程和后向过程,所述前向过程包括前向加噪阶段和前向扩散阶段,
5.根据权利要求4所述的基于条件去噪扩散模型的用电负荷分解数据生成方法,其特征在于,所述后向过程包括:
6.根据权利要求5所述的基于条件去噪扩散模型的用电负荷分解数据生成方法,其特征在于,所述后向去噪阶段中使用预测噪声模型,包括:
7.根据权利要求6所述的基于条件去噪扩散模型的用电负荷分解数据生成方法,其特征在于,所述预测噪声模型还包括:
8.一种基于条件去噪扩散模型的用电负荷分解数据生成装置,其特征在于,包括:
9.根据权利要求8所述的基于条件去噪扩散模型的用电负荷分解数据生成装置,其特征在于,所述预处理模块包括:
10.根据权利要求9所述的基于条件去噪扩散模型的用电负荷分解数据生成装置,其特征在于,所述日期编码模块包括: