本发明涉及数据处理,特别是涉及一种用于工业园区的用电负荷预测模型的训练方法及相关设备。
背景技术:
1、准确预测电力负荷对电网的安全稳定运营至关重要。在针对工业园区负荷预测场景下,由于同一个工业园区会存在多个用电方,且不同用电方的用电参数特征重叠较少,因而为了提高模型的预测精度,通常会采用纵向联邦学习的模型训练方式来训练负荷预测模型。
2、但是,由于在基于纵向联邦学习对负荷预测模型进行训练时,需要供电方向用电方共享训练数据信息以完成本地模型的训练。这就导致在进行数据共享的过程中,易由于参与方伪造数据、第三方网络攻击等行为导致出现数据泄露、数据失真的数据安全风险。因此,如何提高在纵向联邦学习数据共享过程中的数据安全性已成为亟待解决的问题。
技术实现思路
1、本发明实施例的目的在于提供一种用于工业园区的用电负荷预测模型的训练方法及相关设备,以实现提高纵向联邦学习数据共享过程中的数据安全性的发明目的。具体技术方案如下:
2、一种用于工业园区的用电负荷预测模型的训练方法,所述方法包括:
3、供电方设备获得第一样本数据组,至少一个用电方设备获得第二样本数据组;
4、所述供电方设备将第一公钥和部署于本地的第一初始负荷预测模型的配置参数发送至所述用电方设备,并利用所述第一样本数据组对所述第一初始负荷预测模型进行训练,获得模型训练过程中的第一中间结果;
5、所述用电方设备根据所述配置参数更新部署于本地的第二初始负荷预测模型,利用所述第二样本数据组对所述第二初始负荷预测模型进行训练,获得模型训练过程中的第二中间结果,并将所述第二中间结果发送至所述供电方设备;
6、所述供电方设备根据所述第一中间结果、所述第二中间结果和所述第一样本数据组中各样本数据的标签,计算残差的明文,基于所述残差的明文和所述第一样本数据组计算第一梯度,并将由所述第一公钥加密后的所述残差发送至所述用电方设备;
7、所述用电方设备根据由所述第一公钥加密后的所述残差和所述第二样本数据组,求得含加密残差的密文梯度,基于所述第一公钥和第一预设随机数对所述密文梯度进行加密,获得带加密随机数的第二梯度,并将所述第二梯度发送至所述供电方设备;
8、所述供电方设备利用第一私钥对所述第二梯度进行去残差操作,获得带所述加密随机数的第二梯度,并将带所述加密随机数的第二梯度发送至所述用电方设备,其中,所述第一私钥和所述第一公钥是由所述供电方设备生成的密钥对;
9、所述用电方设备利用所述第一公钥和所述第一预设随机数对所述带加密随机数的第二梯度进行去随机数处理,获得明文形式的第二梯度;
10、所述供电方设备基于所述第一梯度控制所述第一初始负荷预测模型的训练过程,所述用电方设备基于所述第二梯度控制所述第二初始负荷预测模型的训练过程。
11、可选的,所述用电方设备根据由所述第一公钥加密后的所述残差和所述第二样本数据组,求得含加密残差的密文梯度,基于所述第一公钥和第一预设随机数对所述密文梯度进行加密,获得带加密随机数的第二梯度,包括:
12、所述用电方设备根据所述第一公钥加密后的所述残差he(t)和所述第二样本数据组xb,通过公式:
13、he(gt2)=sgd(he(t),xb),
14、求得所述含加密残差的密文梯度he(gt2);
15、利用所述第一公钥对所述第一预设随机数进行加密,获得所述加密随机数;
16、将所述含加密残差的密文梯度与所述加密随机数进行组合,获得所述带加密随机数的第二梯度。
17、可选的,所述方法还包括:
18、所述用电方设备根据所述供电方设备发送的数据数量和采样频率,利用预设插值算法对所述用电方设备的样本参数组进行数据粒度细分处理,获得第二初始样本数据组;
19、所述供电方设备根据标识交集组对第一初始样本数据组进行数据筛选,获得所述第一样本数据组;
20、所述用电方设备根据所述标识交集组对所述第二初始样本数据组进行数据筛选,获得所述第二样本数据组,其中,所述标识交集组是基于所述第一初始样本数据组和所述第二初始样本数据组进行隐私求交操作,获得的包括所述第一初始样本数据组和所述第二初始样本数据组中共同的标识符的数据组。
21、可选的,所述隐私求交操作,包括:
22、所述供电方设备利用第二预设随机数对经过第二公钥进行加密后的第一哈希标识组进行加密,获得第一加密数据组,并将所述第一加密数据组发送至所述用电方设备;
23、所述用电方设备利用第二私钥对所述第一加密数据组进行解密,获得经所述第二预设随机数加密的所述第一哈希标识组,并将所述经第二预设随机数加密的所述第一哈希标识组和第二哈希标识组发送至所述供电方设备,其中,所述第二私钥和所述第二公钥是所述用电方设备生成的一组密钥对,所述第二哈希标识组包括经过两次哈希处理的所述第二初始样本数据组中各样本数据的标识符;
24、所述供电方设备在去除所述经第二预设随机数加密的所述第一哈希标识组中的所述第二预设随机数后,对所述第一哈希标识组进行二次哈希处理,并对经过所述二次哈希处理的所述第一哈希标识组和所述第二哈希标识组求交集,获得所述标识交集组;
25、所述供电方设备将所述标识交集组发送至所述用电方设备。
26、可选的,所述供电方设备基于所述第一梯度控制所述第一初始负荷预测模型的训练过程,所述用电方设备基于所述第二梯度控制所述第二初始负荷预测模型的训练过程,包括:
27、在所述第一梯度大于所述预设梯度阈值的情况下,所述供电方设备对所述第一初始负荷预测模型进行调参操作,清除所述第一梯度和所述第一中间结果,并返回执行所述供电方设备将第一公钥和部署于本地的第一初始负荷预测模型的配置参数发送至所述用电方设备,并利用所述第一样本数据组对所述第一初始负荷预测模型进行训练,获得模型训练过程中的第一中间结果的操作和步骤;
28、在所述明文形式的第二梯度大于所述预设梯度阈值的情况下,所述用电方设备对所述第二初始负荷预测模型进行调参操作,清除所述明文形式的第二梯度、所述含加密残差的密文梯度和所述第二中间结果,并返回执行所述用电方设备根据所述配置参数更新部署于本地的第二初始负荷预测模型,利用所述第二样本数据组对所述第二初始负荷预测模型进行训练,获得模型训练过程中的第二中间结果,并将所述第二中间结果发送至所述供电方设备的操作步骤。
29、一种用于工业园区的用电负荷预测模型的训练系统,所述系统包括:供电方设备和至少一个用电方设备,所述供电方设备获得第一样本数据组,所述用电方设备获得第二样本数据组;
30、所述供电方设备将第一公钥和部署于本地的第一初始负荷预测模型的配置参数发送至所述用电方设备,并利用所述第一样本数据组对所述第一初始负荷预测模型进行训练,获得模型训练过程中的第一中间结果;
31、所述用电方设备根据所述配置参数更新部署于本地的第二初始负荷预测模型,利用所述第二样本数据组对所述第二初始负荷预测模型进行训练,获得模型训练过程中的第二中间结果,并将所述第二中间结果发送至所述供电方设备;
32、所述供电方设备根据所述第一中间结果、所述第二中间结果和所述第一样本数据组中各样本数据的标签,计算残差的明文,基于所述残差的明文和所述第一样本数据组计算第一梯度,并将由所述第一公钥加密后的所述残差发送至所述用电方设备;
33、所述用电方设备根据由所述第一公钥加密后的所述残差和所述第二样本数据组,求得含加密残差的密文梯度,基于所述第一公钥和第一预设随机数对所述密文梯度进行加密,获得带加密随机数的第二梯度,并将所述第二梯度发送至所述供电方设备;
34、所述供电方设备利用第一私钥对所述第二梯度进行去残差操作,获得带所述加密随机数的第二梯度,并将带所述加密随机数的第二梯度发送至所述用电方设备,其中,所述第一私钥和所述第一公钥是由所述供电方设备生成的密钥对;
35、所述用电方设备利用所述第一公钥和所述第一预设随机数对所述带加密随机数的第二梯度进行去随机数处理,获得明文形式的第二梯度;
36、所述供电方设备基于所述第一梯度控制所述第一初始负荷预测模型的训练过程,所述用电方设备基于所述第二梯度控制所述第二初始负荷预测模型的训练过程。
37、可选的,所述用电方设备在根据由所述第一公钥加密后的所述残差和所述第二样本数据组,求得含加密残差的密文梯度,基于所述第一公钥和第一预设随机数对所述密文梯度进行加密,获得带加密随机数的第二梯度时被设置为:
38、所述用电方设备根据所述第一公钥加密后的所述残差he(t)和所述第二样本数据组xb,通过公式:
39、he(gt2)=sgd(he(t),xb),
40、求得所述含加密残差的密文梯度he(gt2);
41、利用所述第一公钥对所述第一预设随机数进行加密,获得所述加密随机数;
42、将所述含加密残差的密文梯度与所述加密随机数进行组合,获得所述带加密随机数的第二梯度。
43、可选的,所述供电方设备和所述用电方设备还被设置为:
44、所述用电方设备根据所述供电方设备发送的数据数量和采样频率,利用预设插值算法对所述用电方设备的样本参数组进行数据粒度细分处理,获得第二初始样本数据组;
45、所述供电方设备根据标识交集组对第一初始样本数据组进行数据筛选,获得所述第一样本数据组;
46、所述用电方设备根据所述标识交集组对所述第二初始样本数据组进行数据筛选,获得所述第二样本数据组,其中,所述标识交集组是基于所述第一初始样本数据组和所述第二初始样本数据组进行隐私求交操作,获得的包括所述第一初始样本数据组和所述第二初始样本数据组中共同的标识符的数据组。
47、可选的,所述供电方设备和所述用电方设备在进行所述隐私求交操作时被设置为:
48、所述供电方设备利用第二预设随机数对经过第二公钥进行加密后的第一哈希标识组进行加密,获得第一加密数据组,并将所述第一加密数据组发送至所述用电方设备;
49、所述用电方设备利用第二私钥对所述第一加密数据组进行解密,获得经所述第二预设随机数加密的所述第一哈希标识组,并将所述经第二预设随机数加密的所述第一哈希标识组和第二哈希标识组发送至所述供电方设备,其中,所述第二私钥和所述第二公钥是所述用电方设备生成的一组密钥对,所述第二哈希标识组包括经过两次哈希处理的所述第二初始样本数据组中各样本数据的标识符;
50、所述供电方设备在去除所述经第二预设随机数加密的所述第一哈希标识组中的所述第二预设随机数后,对所述第一哈希标识组进行二次哈希处理,并对经过所述二次哈希处理的所述第一哈希标识组和所述第二哈希标识组求交集,获得所述标识交集组;
51、所述供电方设备将所述标识交集组发送至所述用电方设备。
52、可选的,所述供电方设备在基于所述第一梯度控制所述第一初始负荷预测模型的训练过程,以及所述用电方设备在基于所述第二梯度控制所述第二初始负荷预测模型的训练过程时被设置为:
53、在所述第一梯度大于所述预设梯度阈值的情况下,所述供电方设备对所述第一初始负荷预测模型进行调参操作,清除所述第一梯度和所述第一中间结果,并返回执行所述供电方设备将第一公钥和部署于本地的第一初始负荷预测模型的配置参数发送至所述用电方设备,并利用所述第一样本数据组对所述第一初始负荷预测模型进行训练,获得模型训练过程中的第一中间结果的操作和步骤;
54、在所述明文形式的第二梯度大于所述预设梯度阈值的情况下,所述用电方设备对所述第二初始负荷预测模型进行调参操作,清除所述明文形式的第二梯度、所述含加密残差的密文梯度和所述第二中间结果,并返回执行所述用电方设备根据所述配置参数更新部署于本地的第二初始负荷预测模型,利用所述第二样本数据组对所述第二初始负荷预测模型进行训练,获得模型训练过程中的第二中间结果,并将所述第二中间结果发送至所述供电方设备的操作步骤。
55、一种用于工业园区的用电负荷预测模型的训练设备,所述训练设备包括:
56、处理器;
57、用于存储所述处理器可执行指令的存储器;
58、其中,所述处理器被配置为执行所述指令,以实现如上述任一种所述的用于工业园区的用电负荷预测模型的训练方法。
59、一种计算机可读存储介质,当所述计算机可读存储介质中的指令由用于工业园区的用电负荷预测模型的训练设备的处理器执行时,使得所述训练设备能够执行如上述任一种所述的用于工业园区的用电负荷预测模型的训练方法。
60、本发明实施例提供的用于工业园区的用电负荷预测模型的训练方法及相关设备,可以通过配置第二中间结果作为携带用电方设备样本数据信息的载体,使得供电方设备既可以通过第二中间结果完成第一梯度的计算,又无法通过第二中间结果获得用电方设备的样本数据信息。同时,通过利用第一公钥对残差加密,保证了供电方设备的样本数据信息在数据共享过程中的安全性,且由于用电方设备仅拥有第一公钥,无法对由第一公钥加密后的残差进行解密,保证了供电方设备的样本数据信息的安全性。并且,通过配置带加密随机数的第二梯度,使得供电方设备由于无法获知第一预设随机数导致无法获知上述第二梯度中的用电方设备样本数据信息。最后,通过配置供电方设备对第二梯度进行去残差操作,使得带加密随机数的第二梯度不再携带任何可逆推的供电方设备样本数据信息,从而避免了用电方设备在获得第二梯度明文的过程中,逆推窃取供电方设备样本数据信息的风险。可见,本发明提高了纵向联邦学习数据共享过程中的数据安全性。
61、当然,实施本发明的任一产品或方法必不一定需要同时达到以上所述的所有优点。