多方横向联邦安全聚合方法、系统及计算机存储介质与流程

文档序号：37595664发布日期：2024-04-18 12:32阅读：10来源：国知局

本发明涉及隐私计算领域，尤其涉及一种多方横向联邦安全聚合方法、系统及计算机存储介质。

背景技术：

1、作为分布式机器学习技术，联邦学习核心思想是通过在多个拥有本地数据的数据源间进行分布式模型训练，无需交换本地样本数据，通过交换模型参数等数据的相关中间结果，构建基于虚拟融合数据下的全局模型，实现数据隐私保护和数据共享计算的平衡，即“数据可用不可见、数据不动模型动”应用新范式。根据训练数据在参与方之间的数据特征空间和样本id空间分布情况，联邦学习分为横向联邦学习、纵向联邦学习、迁移联邦学习。

2、在贷款额度预测、房价预测、投资风险预测等场景中，需要采用联邦学习的方式进行模型训练，而在训练过程中需对各参与方的敏感数据进行隐私保护，在此前提下还需要进行有效的聚合，而现有的技术中的横向联邦学习过程中对敏感数据的隐私保护程度不足。

3、针对现有技术中的上述问题，目前还没有一个有效的解决方法。

技术实现思路

1、为解决上述问题，本发明提供一种多方横向联邦安全聚合方法、系统及计算机存储介质，通过对各方生成的初始随机数向量进行循环共享、计算后得到零共享随机数向量，并通过零共享随机数向量对各方本地的子模型参数进行隐藏后，在发起方完成聚合，从而解决了现有技术中横向联邦学习过程中对敏感数据保护程度不足的问题。

2、为达到上述目的，本发明提供了一种多方横向联邦安全聚合方法，包括：发起方与参与方分别随机生成初始随机数向量；其中，每个初始随机数向量与其所属方的子模型参数向量的规模相同；按顺序将每个初始随机数向量发送至未接收过初始随机数向量的一个待接收方，计算各方中本地的初始随机数向量与接收的初始随机数向量之差，各方得到零共享随机数向量；各方根据零共享随机数向量与子模型参数向量计算各方的混淆模糊值，所有参与方将混淆模糊值发送至发起方；发起方根据本地的混淆模糊值及所有参与方的混淆模糊值计算聚合结果，并将聚合结果发送至所有参与方；发起方与参与方根据所述聚合结果进行联邦模型迭代更新，重复迭代上述过程，直至最新预测模型达到收敛标准，得到训练的最终模型。

3、进一步可选的，所述按顺序将每个初始随机数向量发送至未接收过初始随机数向量的一个待接收方，包括：按预定规则将发起方及参与方均作为待接收方进行排序；将每个初始随机数向量发送至所属方的下一方；其中，排最后的一方对应的初始随机数向量发送至排第一的一方。

4、进一步可选的，所述各方根据零共享随机数向量与子模型参数向量计算各方的混淆模糊值，通过下式计算：

5、

6、其中，为i方的混淆模糊值，为i方的子模型参数向量，zerosi为i方的零共享随机数向量。

7、进一步可选的，所述发起方根据本地的混淆模糊值及所有参与方的混淆模糊值计算聚合结果，通过下式计算：

8、

9、其中，为聚合结果，为i方的混淆模糊值，m为发起方和所有参与方的数量。

10、另一方面，本发明还提供了一种多方横向联邦安全聚合系统，包括：随机数向量生成模块，用于发起方与参与方分别随机生成初始随机数向量；其中，每个初始随机数向量与其所属方的子模型参数向量的规模相同；零共享随机数向量计算模块，用于按顺序将每个初始随机数向量发送至未接收过初始随机数向量的一个待接收方，计算各方中本地的初始随机数向量与接收的初始随机数向量之差，各方得到零共享随机数向量；混淆模糊值计算模块，用于各方根据零共享随机数向量与子模型参数向量计算各方的混淆模糊值，所有参与方将混淆模糊值发送至发起方；聚合结果计算模块，用于发起方根据本地的混淆模糊值及所有参与方的混淆模糊值计算聚合结果，并将聚合结果发送至所有参与方；模型更新模块，用于发起方与参与方根据所述聚合结果进行联邦模型迭代更新，重复迭代上述过程，直至最新预测模型达到收敛标准，得到训练的最终模型。

11、进一步可选的，所述零共享随机数向量计算模块，包括：排序子模块，用于按预定规则将发起方及参与方均作为待接收方进行排序；发送子模块，用于将每个初始随机数向量发送至所属方的下一方；其中，排最后的一方对应的初始随机数向量发送至排第一的一方。

12、进一步可选的，所述各方根据零共享随机数向量与子模型参数向量计算各方的混淆模糊值，通过下式计算：

13、

14、其中，为i方的混淆模糊值，为i方的子模型参数向量，zerosi为i方的零共享随机数向量。

15、进一步可选的，所述发起方根据本地的混淆模糊值及所有参与方的混淆模糊值计算聚合结果，通过下式计算：

16、

17、其中，为聚合结果，为i方的混淆模糊值，m为发起方和所有参与方的数量。

18、另一方面，本发明还提供了一种多方横向联邦安全聚合装置，包括上述的多方横向联邦安全聚合系统。

19、另一方面，本发明还提供了一种计算机可读存储介质，其上存储有计算机程序，所述程序被处理器执行时实现上述的多方横向联邦安全聚合方法。

20、上述技术方案具有如下有益效果：通过生成的随机数向量对子模型参数进行模糊，从而实现训练过程中的敏感数据的隐私保护；由于零共享随机数向量实现了向量零，从而保证在完成对数据隐私保护的前提下完成聚合，提高过程中的数据安全性。

技术特征：

1.一种多方横向联邦安全聚合方法，其特征在于，包括：

2.根据权利要求1所述的多方横向联邦安全聚合方法，其特征在于，所述按顺序将每个初始随机数向量发送至未接收过初始随机数向量的一个待接收方，包括：

3.根据权利要求1所述的多方横向联邦安全聚合方法，其特征在于，所述各方根据零共享随机数向量与子模型参数向量计算各方的混淆模糊值，通过下式计算：

4.根据权利要求1所述的多方横向联邦安全聚合方法，其特征在于，所述发起方根据本地的混淆模糊值及所有参与方的混淆模糊值计算聚合结果，通过下式计算：

5.一种多方横向联邦安全聚合系统，其特征在于，包括：

6.根据权利要求5所述的多方横向联邦安全聚合系统，其特征在于，所述零共享随机数向量计算模块，包括：

7.根据权利要求5所述的多方横向联邦安全聚合系统，其特征在于，所述各方根据零共享随机数向量与子模型参数向量计算各方的混淆模糊值，通过下式计算：

8.根据权利要求5所述的多方横向联邦安全聚合系统，其特征在于，所述发起方根据本地的混淆模糊值及所有参与方的混淆模糊值计算聚合结果，通过下式计算：

9.一种多方横向联邦安全聚合装置，其特征在于，包括权利要求5-8任一项所述的多方横向联邦安全聚合系统。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述程序被处理器执行时实现如权利要求1-4任一项所述的多方横向联邦安全聚合方法。

技术总结
本发明实施例公开了一种多方横向联邦安全聚合方法、系统及计算机存储介质，其中，该方法包括：各方分别随机生成初始随机数向量；按顺序将每个初始随机数向量发送至未接收过初始随机数向量的一个待接收方，计算各方中本地的初始随机数向量与接收的初始随机数向量之差，各方得到零共享随机数向量；各方根据零共享随机数向量与子模型参数向量计算各方的混淆模糊值，参与方将混淆模糊值发至发起方；发起方根据本地混淆模糊值及参与方混淆模糊值计算聚合结果，并将聚合结果发送至所有参与方；发起方与参与方根据聚合结果进行联邦模型迭代更新，重复迭代上述过程，直至最新预测模型达到收敛标准，得到训练的最终模型。提高了敏感数据的安全性。

技术研发人员：马平,兰春嘉
受保护的技术使用者：上海零数众合信息科技有限公司
技术研发日：
技术公布日：2024/4/17

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：马平,兰春嘉
技术所有人：上海零数众合信息科技有限公司
我是此专利的发明人

上一篇：一种基于流行度动态维数的嵌入向量生成方法及其系统
上一篇：一种兼具不确定性和代表性的主动学习框架

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。