基于交集保护的数据处理装置的制作方法

文档序号:36333417发布日期:2023-12-10 15:47阅读:53来源:国知局
基于交集保护的数据处理装置的制作方法

本发明涉及数据处理,尤其涉及一种基于交集保护的数据处理装置。


背景技术:

1、随着人工智能及大数据技术的发展,人们对相关技术所涉及隐私问题逐步关心,法律法规也对数据流通过程的隐私保护具有明确规范。因此,机构之间由于数据流通合规性问题导致大量数据孤岛存在。联邦学习是一种解决数据孤岛的关键技术,它通过密码学和分布式机器学习进行结合,使多方数据能安全完成联合的模型训练,提升模型性能。另外,数据分析在业务中具有重要作用,安全联合分析也是数据安全流通、数据可用不可见的关键技术。它通过安全多方计算mpc和数据分析技术结合,是多方数据能共同完成数据分析,提升智能决策、智能分析能力。

2、联邦学习的模型训练中,按照数据的划分方式可分为横向联邦学习和纵向联邦学习。横向联邦学习是多个参与方具有相同维度特征,但具有不同样本的联合学习模型。纵向联邦学习是多个参与方具有相同样本,但各自有相同样本的不同特征的联合学习模型。

3、在纵向联邦学习中,通常首先需要将参与方之间的数据进行安全求交(隐私集合求交),得到待学习的共同样本,再进行后续的联合学习。一般的安全求交通常是在保护双方非交集样本情况下得到共有交集样本,且存在多种实现方案,如rsa盲签名、diffie-hellman密钥协商、混淆布隆过滤器、不经意伪随机函数(oprf)、不经意可编程伪随机函数opprf、向量不经意线性评估vole等。一般安全求交之后会透露共有交集样本信息,然而在部分场景或参与方限制下,需要同时保护交集样本前提下进行纵向联邦学习训练。因此,一般的安全求交方案不能达到要求。同样,安全联合分析也存在类似问题。在联合分析中,通常需要对多方数据进行join计算,而join计算需要指定join联表的特定字段。为了保护参与方的所有数据不被泄漏,需要对联表字段的数据在密态下进行表对齐。


技术实现思路

1、本发明提供一种基于交集保护的数据处理装置,用以解决现有技术中求交集会泄露共有信息且处理效率低的缺陷,实现对交集数据的保护并提高数据处理效率的效果。

2、本发明提供一种基于交集保护的数据处理装置,所述装置至少包括第一参与设备与第二参与设备,

3、所述第一参与设备用于对持有的各样本id进行可交换加密计算,得到各第一可交换加密id,并对持有的各样本对应的特征进行同态加密,得到各第一同态加密特征;所述第一参与设备将各第一可交换加密id与各第一同态加密特征发送至第二参与设备,并接收所述第二参与设备发送的第二参与设备的各第二可交换加密id和各第二同态加密特征;

4、所述第一参与设备还用于对所述第二参与设备的各第二可交换加密id进行二次可交换加密,得到各第二二次可交换加密id,并基于各第二同态加密特征确定各第二二次可交换加密id对应的独有第二特征秘密份额;所述第一参与设备将各第二二次可交换加密id以及各第二二次可交换加密id对应的目标第二特征秘密份额作为元祖发送至所述第二参与设备,并接收所述第二参与设备发送的各第一二次可交换加密id和各第一二次可交换加密id对应的目标第一特征秘密份额所构成的元祖;所述第一参与设备根据计算任务对接收到的各元祖进行处理,得到所述第一参与设备与所述第二参与设备的整体秘密分享。

5、根据本发明提供的一种基于交集保护的数据处理装置,所述第一参与设备还用于生成各第二同态加密特征对应的随机向量,并分别与对应的各第二同态加密特征进行相减,得到各第二二次可交换加密id对应的目标第二特征秘密份额。

6、根据本发明提供的一种基于交集保护的数据处理装置,所述第一参与设备还用于将各第二二次可交换加密id以及各第二二次可交换加密id对应的目标第二特征秘密份额作为元祖;所述第一参与设备将各第二二次可交换加密id对应的元祖组成的列表进行随机排序后发送至所述第二参与设备,并确定各第二同态加密特征对应的随机向量的元祖。

7、根据本发明提供的一种基于交集保护的数据处理装置,所述计算任务为纵向联邦学习,所述第一参与设备还用于对接收到的各元祖中的各第一二次可交换加密id对应的目标第一特征秘密份额进行解密,并按照各样本id与各第二同态加密特征对应的随机向量的元祖进行求交,得到第一交集;在所述第一交集正确性验证通过的情况下,所述第一参与设备将所述第一交集对应的元祖进行纵向拼接,得到所述第一交集的整体秘密分享。

8、根据本发明提供的一种基于交集保护的数据处理装置,所述计算任务为安全联合分析的join计算,所述第一参与设备还用于对接收到的各元祖中的各第一二次可交换加密id对应的目标第一特征秘密份额进行解密,并按照各样本id与各第二同态加密特征对应的随机向量的元祖进行双层循环遍历,确定与所述第一二次可交换加密id匹配的特征,得到匹配特征集;所述第一参与设备用于基于所述匹配特征集,将对应样本的元祖按特征列进行纵向拼接,得到所述join计算的整体秘密分享。

9、根据本发明提供的一种基于交集保护的数据处理装置,所述join计算为目标类型的join计算,在未确定出与所述第一二次可交换加密id匹配的特征的情况下,所述第一参与设备还用于生成与所述第一参与设备对应的特征相同数据列大小的零向量的特征秘密份额。

10、根据本发明提供的一种基于交集保护的数据处理装置,所述目标类型的join计算为左连接、右连接或者全连接。

11、根据本发明提供的一种基于交集保护的数据处理装置,所述第一参与设备还用于确定安全素数q以及所述安全素数对应的欧拉函数;所述安全素数q的值大于目标阈值;所述第一参与设备将与所述欧拉函数互素的整数e作为公钥对各样本id进行可交换加密计算,得到各第一可交换加密id。

12、根据本发明提供的一种基于交集保护的数据处理装置,第一参与设备对持有的各样本对应的特征进行同态加密的同态加密算法为paillier算法、bfv算法以及bgv算法中的至少一个。

13、根据本发明提供的一种基于交集保护的数据处理装置,所述第一参与设备为中央服务器、云平台、边缘服务器、边缘计算设备以及私有数据中心中的任一个。

14、本发明还提供一种基于交集保护的数据处理方法,所述方法应用于第一参与设备,所述方法包括:对持有的各样本id进行可交换加密计算,得到各第一可交换加密id,并对持有的各样本对应的特征进行同态加密,得到各第一同态加密特征;将各第一可交换加密id与各第一同态加密特征发送至第二参与设备,并接收所述第二参与设备发送的第二参与设备的各第二可交换加密id和各第二同态加密特征;对所述第二参与设备的各第二可交换加密id进行二次可交换加密,得到各第二二次可交换加密id,并基于各第二同态加密特征确定各第二二次可交换加密id对应的独有第二特征秘密份额;将各第二二次可交换加密id以及各第二二次可交换加密id对应的目标第二特征秘密份额作为元祖发送至所述第二参与设备,并接收所述第二参与设备发送的各第一二次可交换加密id和各第一二次可交换加密id对应的目标第一特征秘密份额所构成的元祖;根据计算任务对接收到的各元祖进行处理,得到所述第一参与设备与所述第二参与设备的整体秘密分享。

15、本发明还提供一种基于交集保护的数据处理方法,所述方法应用于第二参与设备,所述方法包括:对持有的各样本id进行可交换加密计算,得到各第二可交换加密id,并对持有的各样本对应的特征进行同态加密,得到各第二同态加密特征;将各第二可交换加密id与各第二同态加密特征发送至第一参与设备,并接收所述第一参与设备发送的第一参与设备的各第一可交换加密id和各第一同态加密特征;对所述第一参与设备的各第一可交换加密id进行二次可交换加密,得到各第一二次可交换加密id,并基于各第一同态加密特征确定各第一二次可交换加密id对应的独有第一特征秘密份额;将各第一二次可交换加密id以及各第一二次可交换加密id对应的目标第一特征秘密份额作为元祖发送至所述第一参与设备,并接收所述第一参与设备发送的各第二二次可交换加密id和各第二二次可交换加密id对应的目标第二特征秘密份额所构成的元祖;根据计算任务对接收到的各元祖进行处理,得到所述第一参与设备与所述第二参与设备的整体秘密分享。

16、本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述基于交集保护的数据处理方法。

17、本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述基于交集保护的数据处理方法。

18、本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述基于交集保护的数据处理方法。

19、本发明提供的基于交集保护的数据处理装置,通过对各样本id进行可交换加密,可以便于样本id进行快速安全求交,而对特征数据进行同态加密,便于特征数据进行安全训练或分析,而在在样本id进行二次可交换加密后,与加密特征数据组成元祖,然后发送给另一方,可以保证样本交集信息不会泄漏,且在密文求交后的id可直接作为密文样本id使用,而不需要进行密态对齐,在密文求交后直接得到密态下的交集,也不需要使用特定密态对齐的秘密分享作为交集结果的标记列,提高了数据处理效率。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1