电力数据参与数据共享计算的贡献度预测方法及系统与流程

文档序号:36899818发布日期:2024-02-02 21:30阅读:18来源:国知局
电力数据参与数据共享计算的贡献度预测方法及系统与流程

本发明涉及电力数据参与多节点数据共享计算,尤其涉及一种电力数据参与数据共享计算的贡献度预测方法及系统。


背景技术:

1、电力系统是现代社会运转的核心,不仅为日常生活提供基本需求,还对工业生产和社会发展起到了关键作用。电力系统信息化改造时间较早,如今积累了大量的优质数据,自身在谋求数据价值释放的同时,也在担心与其他节点数据共享时会发生数据隐私、数据应用安全问题,以及数据共享时各节点数据贡献度难以衡量的问题。通常多个数据提供方作为多个数据节点参与计算过程,各方的贡献度不尽相同且难以评估。在这种情况下,需要建立完善的多节点数据贡献度预测方法,提高各方参与联合分析的积极性,从而提升数据价值的发挥。传统的贡献度预测方法,如基于线性模型和经验的方法,开始暴露出其局限性,尤其是在处理大规模、复杂交互的现代电网数据时,这些方法往往显得捉襟见肘。因此,研究者们开始寻求新的解决策略。

2、近年来,随着大数据、人工智能和机器学习技术的飞速发展,深度学习和机器学习在众多领域都取得了显著的成果,如图像识别、自然语言处理等。然而,将这些技术应用于多节点数据共享计算任务的节点数据贡献度预测中,特别是在大量分布式数据环境下,其仍面临诸多挑战。例如,多节点数据来自不同数据源,各数据源的主体拥有者对数据共享计算的安全性存在质疑,大数据源节点和小数据源节点在参与共享计算时其贡献度难以衡量等,因此数据的采集、整合和计算十分复杂,使得现有的深度学习模型难以直接应用到多节点数据共享计算任务的节点数据贡献度预测中。


技术实现思路

1、为解决上述现有技术的不足,本发明提供了一种电力数据参与数据共享计算的贡献度预测方法及系统,利用哈希和公私钥加密法进行数据安全对齐,并通过构建基于纵向联邦学习(vfl,vertical federated learning)和图卷积神经网络(gcn,graphconvolutional network)的多节点数据共享计算任务模型,结合深度特征提取,实现在不共享原始数据的前提下对多节点数据的贡献度进行分析,解决传统经验方法所面临的局限性和数据隐私保护问题。

2、第一方面,本发明提供了一种电力数据参与数据共享计算的贡献度预测方法。

3、一种电力数据参与数据共享计算的贡献度预测方法,包括:

4、获取作为中心节点的电力生产者及其周围节点的数据样本;

5、采用哈希和公私钥加密法,对中心节点及其周围节点的数据样本进行数据对齐处理;

6、将经过数据对齐处理后的中心节点及其周围节点的数据输入至数据共享计算任务模型中,输出每个节点的计算结果,获取本次计算的性能指标值,并将本次的性能指标值作为基线配置;

7、在每次迭代过程中去除任一节点,再将剩余节点的数据输入至数据共享计算任务模型中,输出每个节点的计算结果,记录每次迭代计算的性能指标值,将当前次迭代的性能指标值与基线配置相对比,计算去除节点的贡献度得分;

8、不断循环迭代,直至遍历所有节点,获取所有节点的贡献度得分。

9、进一步的技术方案,所述数据共享计算任务模型包括纵向联邦学习模型和基于中心节点及其周围节点连接关系构建的图神经网络模型,所述纵向联邦学习模型包括中心模型、周围模型和顶层模型,中心模型和周围模型分别提取并输出中心节点和周围节点的数据特征,顶层模型拼接所有节点的数据特征,拼接后的数据特征输入至图神经网络模型中进行数据特征更新,再通过全连接层输出每个节点的计算结果。

10、进一步的技术方案,所述性能指标包括准确度、精确度、召回率和f1分数,以及包括真阳性、真阴性、假阳性、假阴性的混淆矩阵;

11、所述将当前次迭代的性能指标值与基线配置相对比,计算去除节点的贡献度得分,包括:计算当前次迭代的各性能指标值与对应的基线配置的差值,根据差值相加减,计算得到去除节点的贡献度得分,所述贡献度得分的计算公式为:

12、score=δacc+δpre+δrecall+δf1+δtp+δtn-δfp-δfn

13、上式中,score表示贡献度得分,δacc表示准确度变化,δpre表示精确度变化,δrecall表示召回率变化,δf1表示f1分数值的变化,δtp表示真阳性的变化,δtn表示真阴性的变化,δfp表示假阳性的变化,δfn表示假阴性的变化。

14、进一步的技术方案,对计算获取的所有节点的贡献度得分进行归一化处理,得到每一节点相对于整个数据共享计算任务的贡献度。

15、进一步的技术方案,所述采用哈希和公私钥加密法,对中心节点及其周围节点的数据样本进行数据对齐处理,包括:

16、每一数据样本对应一个唯一的id,对中心节点及其周围节点的每一数据样本进行哈希处理,获取每一数据样本id的哈希值;

17、中心节点利用公私钥加密法,生成一对公钥和私钥,保留私钥并将公钥发送至周围节点;

18、周围节点利用接收的公钥对节点自身的每一数据样本id的哈希值进行加密,并将加密后的值发送至中心节点;

19、中心节点利用私钥对接收到的值进行解密,并将解密后的id列表以及中心节点自身的样本数据id列表进行对比,确定共有id,根据共有id获取每一节点共有id所对应的数据样本,完成数据对齐处理。

20、进一步的技术方案,所述中心模型包括依次连接的第一线性层、第一relu激活层、第二线性层和第二relu激活层,经过数据对齐处理后的中心节点的数据输入至中心模型,中心模型提取并输出中心节点的数据特征,包括:

21、经过数据对齐处理后的中心节点的数据首先通过第一线性层,将输入数据转换到隐藏层,提取数据特征;

22、提取的数据特征再通过第一relu激活层,以此捕获数据之间的非线性关系;

23、之后再通过第二线性层加工所提取的数据特征和非线性关系;

24、最后通过第二relu激活层输出最终所提取的数据特征。

25、进一步的技术方案,所有节点的数据特征拼接后构成数据特征矩阵,数据特征矩阵输入至图神经网络模型中进行数据特征更新,包括:

26、基于中心节点及其周围节点的连接关系构建图神经网络模型,获取节点的邻接矩阵;

27、基于节点的邻接矩阵,计算获取度矩阵;

28、利用度矩阵,对节点的邻接矩阵进行归一化处理;

29、根据归一化处理后的邻接矩阵,结合数据特征矩阵和权重矩阵,更新所有节点的数据特征。

30、进一步的技术方案,顶层模型拼接所有节点的数据特征,其中拼接后的数据特征为:

31、

32、上式中,centeroutput表示中心模型的输出特征,表示第i个周围模型的输出特征,n表示周围节点的数量。

33、第二方面,本发明提供了一种电力数据参与数据共享计算的贡献度预测系统。

34、一种电力数据参与数据共享计算的贡献度预测系统,包括:

35、数据获取模块,用于获取作为中心节点的电力生产者及其周围节点的数据样本;

36、数据预处理模块,用于采用哈希和公私钥加密法,对中心节点及其周围节点的数据样本进行数据对齐处理;

37、数据共享计算模块,用于将经过数据对齐处理后的中心节点及其周围节点的数据输入至数据共享计算任务模型中,输出每个节点的计算结果,获取本次计算的性能指标值,并将本次的性能指标值作为基线配置;

38、多节点贡献度预测模块,用于在每次迭代过程中去除任一节点,再将剩余节点的数据输入至数据共享计算任务模型中,输出每个节点的计算结果,记录每次迭代计算的性能指标值,将当前次迭代的性能指标值与基线配置相对比,计算去除节点的贡献度得分;不断循环迭代,直至遍历所有节点,获取所有节点的贡献度得分。

39、第三方面,本公开还提供了一种电子设备,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成第一方面所述方法的步骤。

40、第四方面,本公开还提供了一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成第一方面所述方法的步骤。

41、以上一个或多个技术方案存在以下有益效果:

42、1、本发明提供了一种基于vfl和gcn的电力数据参与数据共享计算的贡献度预测方法及系统,通过构建基于纵向联邦学习和图卷积神经网络的多节点数据共享计算任务模型,结合深度特征提取,实现在不共享原始数据的前提下对多节点数据的贡献度进行分析,解决传统经验方法所面临的局限性和数据隐私保护问题。

43、2、本发明中,利用哈希和公私钥加密法进行数据安全对齐,确保了数据对齐的准确性,同时提供了强大的隐私保护,使得电力系统四星型框架中的所有节点都能有效、安全地参与后续的纵向联邦学习。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1