数据隐私保护的方法及终端设备与流程

文档序号:30615012发布日期:2022-07-02 00:44阅读:90来源:国知局
数据隐私保护的方法及终端设备与流程

1.本发明属于加密技术领域,尤其涉及数据隐私保护的方法及终端设备。


背景技术:

2.在纵向联邦学习的训练过程开始前,需要把每个数据节点中的样本数据按照用户id或物品、设备id,做join操作,得到交集集合(private set intersection)。这个过程要求隐私保护,任意节点之间只能获知最终交集中的数据,除此之外的部分都不能暴露。
3.目前开源社区关于这个方案的实现不是很统一,方法比较多样。已有的技术方案能够解决psi过程。但是通过md5的加密方式,隐私保护上有隐患,可能存在利用加密后内容反向暴力撞库的方式破解。
4.为解决现用技术的方法,有必要提出一种数据隐私保护的方法。


技术实现要素:

5.有鉴于此,本发明提出了一种数据隐私保护的方法,其中,本文的目的是解决隐私保护的问题。
6.本发明实施例的第一方面提供了一种数据隐私保护的方法,其中,包括:
7.获取响应节点生成加密响应公钥、响应私钥、响应模数和对应的加密节点数据;
8.基于所述加密响应公钥、响应私钥以及响应模数,对待加密的发起数据进行加密以得到第一加密数据;
9.响应于所述第一加密数据的反馈信息,对待加密的响应数据进行加密,以得到第二加密数据;
10.基于所述第二加密数据,对所述发起数据进行加密以得到所述发起节点的第三加密数据;
11.将所述第三加密数据和所述加密节点数据进行交集运算,以得到交集运算结果;以及
12.根据所述交集运算结果,确定隐私保护策略。
13.如上所述的数据隐私保护的方法,其中,发起节点使用所述响应公钥将发起公钥进行加密以得到发起私钥。
14.如上所述的数据隐私保护的方法,其中,所述响应节点使用所述响应私钥对所述发起节点的第一加密数据进行加密以得到所述发起节点的第二加密数据。
15.如上所述的数据隐私保护的方法,其中,所述发起节点使用所述发起私钥对所述发起节点的第二加密数据进行加密以得到所述发起节点的第三加密数据。
16.如上所述的数据隐私保护的方法,其中,所述发起节点利用布隆过滤器求出所述发起节点的第三加密数据和所述响应节点的加密数据的所述交集运算结果。
17.如上所述的数据隐私保护的方法,其中,还包括:数据基于哈希函数得到序列上的激活位,响应于所述激活位上的值为1,则判定所述数据位于所述交集运算结果内。
18.本发明实施例的第二方面提供了一种在数据节点之间获取交集集合的装置,其中,包括:
19.获取模块,其用于获取响应节点生成加密响应公钥、响应私钥、响应模数和对应的加密节点数据;
20.第一加密模块,其基于所述加密响应公钥、响应私钥以及响应模数,对待加密的发起数据进行加密以得到第一加密数据;
21.第二加密模块,其响应于所述第一加密数据的反馈信息,对待加密的响应数据进行加密,以得到第二加密数据;
22.第三加密模块,其基于所述第二加密数据,对所述发起数据进行加密以得到所述发起节点的第三加密数据;以及
23.计算模块,其将所述第三加密数据和所述加密节点数据进行交集运算,以得到交集运算结果;以及
24.确定模块,其用于根据所述交集运算结果,确定隐私保护策略。
25.如上所述的在数据节点之间获取交集集合的装置,其中,还包括判定模块:其用于使数据基于哈希函数得到序列上的激活位,响应于所述激活位上的值为1,则判定所述数据位于所述交集运算结果内。
26.本发明实施例的第三方面提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其中,所述处理器执行所述计算机程序时实现如上所述方法的步骤。
27.本发明实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其中,所述计算机程序被处理器执行时实现如上所述方法的步骤。
28.本文的方法把rsa加密方法和布隆过滤器应用在这个过程,在隐私保护上可以完全保护,同时在join操作过程里,布隆过滤器的查找效率也比较快。
附图说明
29.为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
30.图1是本发明实施例提供的数据隐私保护的方法的流程图;
31.图2是本发明实施例提供的数据隐私保护的方法的实现流程示意图;
32.图3是本发明实施例提供的激活一个序列上的某些位的示意图;
33.图4是本发明实施例提供的在数据节点之间获取交集集合的装置的示意图;
34.图5是本发明实施例提供的终端设备的示意图。
具体实施方式
35.以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的系统、装置、电
路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。
36.为了说明本发明所述的技术方案,下面通过具体实施例来进行说明。
37.如图1所示,本发明的实施例提供了一种数据隐私保护的方法,其中,该方法包括:
38.s101:获取响应节点生成加密响应公钥、响应私钥、响应模数和对应的加密节点数据;
39.具体地,在多个数据节点(例如a、b、c数据节点)中,选择a作为发起节点,b与c作为响应节点。接下来以a和b之间的操作详细举例,其中,需要说明地是也可以为两个数据节点、四个数据节点以及更多个数据节点,在此不做具体限定,均在本发明的范围之内。
40.响应节点生成加密响应公钥(即响应节点所对应的数据节点的公钥)、响应私钥(即响应节点所对应的数据节点的私钥)以及响应模数(即响应节点所对应的数据节点的模数);
41.具体地,数据节点a(后简称为a)首先要求数据节点b生成一套rsa加密需要的公钥、私钥、模数等。b完成生成后,把公钥e、模数n发送给a,如流程图2中的step a。
42.s102:基于加密响应公钥、响应私钥以及响应模数,对待加密的发起数据进行加密以得到第一加密数据;
43.具体地,a接到公钥、模数后,依据b数据节点的模数生成一套自己的随机因子公钥r、私钥r_inv。把自身公钥r使用公钥e进行加密得到r_env,对自己的数据ui加密,得到第一加密数据ya。把第一加密数据ya发送给b。如step b。
44.s103:响应于第一加密数据的反馈信息,对待加密的响应数据进行加密,以得到第二加密数据;
45.具体地,b接到a的第一加密数据ya后,使用私钥d对ya加密签名,这可以把公钥e的加密进行抵消,但是对a的r公钥加密是不能抵消的,把a的数据就变成了第二加密数据za。同时b把自己的数据用私钥d加密签名,得到响应节点的加密数据zb,把第二加密数据za和响应节点的加密数据zb都发送给a,如step c。
46.s104:基于第二加密数据,对发起数据进行加密以得到发起节点的第三加密数据。
47.具体地,数据节点a接到第二加密数据za和响应节点的加密数据zb之后,对曾经自己的数据za使用自身私钥r_inv做一次加密签名后,可以把步骤s103)中的自身公钥r的加密进行抵消,这样得到的加密数据da和响应节点的加密数据zb就都只有了来自b的私钥加密的效果,a对它们都无法最终解密,所以看不到b的数据隐私。
48.s106:将第三加密数据和加密节点数据进行交集运算,以得到交集运算结果(也称为交集集合)。
49.具体地,数据节点a使用布隆过滤器求出加密数据da和响应节点的加密数据的交集,交集部分回传给b,如step d。
50.根据所述交集运算结果,确定隐私保护策略。
51.在一具体实施例中,本发明的数据隐私保护的方法还包括:其用于使数据基于哈希函数得到序列上的激活位,响应于所述激活位上的值为1,则判定所述数据位于所述交集集合内。
52.具体地,步骤s106)中的布隆过滤器,如示意图3,x、y、z三条数据根据哈希函数的结果去激活一个序列上的某些位,置为1;当又有数据w,需要判断w是否就位于{x、y、z}集合
中,w根据哈希函数得到该序列上的激活位,查找这三个激活位是否已经被置为1,如果全都为1,那么可以判断w就在{x、y、z}集合内,否则就不在该集合内。
53.在纵向联邦学习的训练过程开始前,需要把每个数据节点中的样本数据按照用户id或物品、设备id,做join操作,得到交集集合(private set intersection)。这个过程要求隐私保护,任意节点之间只能获知最终交集中的数据,除此之外的部分都不能暴露。
54.此外,对psi(private set intersection)的主要技术组成进行如下描述。
55.(1)rsa非对称加密,基于公钥、私钥。加密方持有公钥,对待传递消息加密,发送到解密方,解密方持有公钥、私钥,将已加密的内容还原,得到原始内容。公钥与私钥起到的是互相抵消的作用。
56.(2)布隆过滤器,基于哈希计算函数f,把特定一个数据集合a中的每条数据,计算映射到一个二进制序列seq上,某些位就会被激活设置为1,未被激活过的位都是0。当其他一个数据集合b对当前数据集合a计算交集时,把b中每条数据使用f计算之后得到的二进制激活位,查找seq上的对应位是否为激活状态,如是,那么b中的当前数据位于a与b的交集中。
57.目前开源社区关于这个方案的实现不是很统一,方法比较多样。本发明的方法把rsa加密方法和布隆过滤器应用在这个过程,在隐私保护上可以完全保护,同时在join操作过程里,布隆过滤器的查找效率也比较快。
58.如图4所示,在本发明的一具体实施例中,还提出了一种数据隐私保护的装置,其中,该装置包括:
59.获取模块401,其用于获取响应节点生成加密响应公钥、响应私钥、响应模数和对应的加密节点数据;
60.第一加密模块402,其基于所述加密响应公钥、响应私钥以及响应模数,对待加密的发起数据进行加密以得到第一加密数据;
61.第二加密模块403,其响应于所述第一加密数据的反馈信息,对待加密的响应数据进行加密,以得到第二加密数据;
62.第三加密模块404,其基于所述第二加密数据,对所述发起数据进行加密以得到所述发起节点的第三加密数据;以及
63.计算模块405,其将所述第三加密数据和所述加密节点数据进行交集运算,以得到交集运算结果;以及
64.确定模块406,其用于根据所述交集运算结果,确定隐私保护策略。
65.在一具体实施例中,本发明的在数据节点之间获取交集集合的装置还包括判定模块:其用于使数据基于哈希函数得到序列上的激活位,响应于激活位上的值为1,则判定数据位于交集集合内。
66.本实施例中的在数据节点之间获取交集集合的装置的各个模块与上述方法的各个步骤相对应,在此不再进行赘述。
67.图5是本发明一实施例提供的终端设备的示意图。如图5所示,该实施例的终端设备5包括:处理器50、存储器51以及存储在所述存储器51中并可在所述处理器50上运行的计算机程序52,例如纵向联邦学习线性回归程序。所述处理器50执行所述计算机程序52时实现上述各个纵向联邦学习线性回归的方法实施例中的步骤,例如图1所示的步骤101至106。
或者,所述处理器50执行所述计算机程序52时实现上述各装置实施例中各模块/单元的功能,例如图4所示模块401至406的功能。
68.示例性的,所述计算机程序52可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器51中,并由所述处理器50执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序52在所述终端设备5中的执行过程。
69.所述终端设备5可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述终端设备可包括,但不仅限于,处理器50、存储器51。本领域技术人员可以理解,图5仅仅是终端设备5的示例,并不构成对终端设备5的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述终端设备还可以包括输入输出设备、网络接入设备、总线等。
70.所称处理器50可以是中央处理单元(central processing unit,cpu),还可以是其它通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现场可编程门阵列(field-programmable gate array,fpga)或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
71.所述存储器51可以是所述终端设备5的内部存储单元,例如终端设备5的硬盘或内存。所述存储器51也可以是所述终端设备5的外部存储设备,例如所述终端设备5上配备的插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)等。进一步地,所述存储器51还可以既包括所述终端设备5的内部存储单元也包括外部存储设备。所述存储器51用于存储所述计算机程序以及所述终端设备所需的其它程序和数据。所述存储器51还可以用于暂时地存储已经输出或者将要输出的数据。
72.所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本技术的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
73.在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
74.本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
75.在本发明所提供的实施例中,应该理解到,所揭露的装置/终端设备和方法,可以
通过其它的方式实现。例如,以上所描述的装置/终端设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
76.所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
77.另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
78.所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
79.以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1