数据处理方法、装置、设备及存储介质与流程

文档序号:37155723发布日期:2024-02-26 17:16阅读:14来源:国知局
数据处理方法、装置、设备及存储介质与流程

本技术涉及通信,尤其涉及一种数据处理方法、装置、设备及存储介质。


背景技术:

1、对多方隐私数据集合求交集可以应用于广告定向投放、医疗数据共享等场景,例如,通过确定广告商的用户数据集合和厂商的用户数据集合的交集,可以确定通过观看广告而购买厂商的产品的用户数量,进而可以确定广告转换率。现有技术通常是每个参与者将自己的隐私数据集合进行加密,并将加密后的隐私数据集合发送给多个参与者中的一个参与者,由该参与者计算多个参与者对应的隐私数据集合的交集。

2、但是,上述方法对多个加密后的隐私数据集合求交集,运算量大,效率低。


技术实现思路

1、本技术提供一种数据处理方法、装置、设备及存储介质,以至少解决现有技术对多个加密后的隐私数据集合求交集,运算量大,效率低的问题。本技术的技术方案如下:

2、第一方面,提供一种数据处理方法,应用于第一请求端,第一请求端归属于数据处理系统,数据处理系统还包括:至少一个第二请求端、第三请求端、第一服务器和第二服务器。一个请求端对应一个数据集。第一请求端的数据传输能力满足数据传输条件。该方法包括:根据第一数据集,确定第一打包值和多个第二打包值,并向第一服务器发送多个第二打包值。第一数据集为第一请求端对应的数据集。第一打包值为:对第一数据集进行打包得到的。第二打包值为:对第一数据集进行数据去除后的数据集进行打包得到的。将第一打包值与第二请求端发送的第三打包值相乘,得到目标值,并向第二服务器发送目标值。第三打包值为第二请求端对第二数据集进行打包得到的。第二数据集为第二请求端对应的数据集。接收来自第一服务器的多个第四打包值和来自第二服务器的多个第五打包值,并根据多个第四打包值和多个第五打包值,确定第一数据集、第二数据集和第三数据集的交集中的数据数量。第四打包值为第一服务器根据第一请求端发送的多个第二打包值、第二请求端发送的多个第六打包值和第三请求端发送的多个第七打包值确定的。第六打包值为第二请求端对第二数据集进行数据去除后的数据集进行打包得到的。第七打包值为第三请求端对第三数据集中的数据进行打包得到的。第三数据集为第三请求端对应的数据集。第五打包值为第二服务器根据第三请求端发送的多个第八打包值和目标值确定的。第八打包值为第三请求端对多个预设随机数进行打包得到的。

3、在一种可能的实施方式中,根据第一数据集,确定多个第二打包值,包括:根据第一数据集,确定多个第二打包值。多个第二打包值中的第i个打包值为:对去除第一数据集中的第i个数据后的数据集进行打包得到的。i为小于或等于第一数据集中的数据数量的正整数。

4、第二方面,提供一种数据处理方法,应用于第三请求端,第三请求端归属于数据处理系统,数据处理系统还包括:第一请求端、至少一个第二请求端、第一服务器和第二服务器。一个请求端对应一个数据集。第一请求端的数据传输能力满足数据传输条件。该方法包括:根据第三数据集中的每个数据的数据值、多个预设随机数,确定多个第七打包值。第三数据集为第三请求端对应的数据集。向第一服务器发送多个第七打包值,以使得第一服务器根据多个第七打包值,确定多个第四打包值。多个第四打包值用于第一请求端确定第一数据集、第二数据集和第三数据集的交集中的数据数量。第一数据集为第一请求端对应的数据集,第二数据集为第二请求端对应的数据集。根据多个预设随机数,确定多个第八打包值。向第二服务器发送多个第八打包值,以使得第二服务器根据多个第八打包值,确定多个第五打包值。多个第五打包值用于第一请求端确定第一数据集、第二数据集和第三数据集的交集中的数据数量。

5、在一种可能的实施方式中,第三数据集中的每个数据的数据值、预设随机数和第七打包值,满足下述表达式:

6、

7、un为第三数据集中第n个数据对应的第七打包值,g1为第一预设数值,x1为第三数据集,(x1,n)为第三数据集中第n个数据的数据值,s′为第二预设数值,tn为多个预设随机数中的第n个预设随机数。n为小于或等于第三数据集中的数据数量的正整数。

8、在一种可能的实施方式中,预设随机数和第八打包值满足下述表达式:

9、

10、td为多个预设随机数中第d个预设随机数对应的第八打包值,g1为第一预设数值,td为第d个预设随机数。d为小于或等于第三数据集中的数据数量的正整数。

11、第三方面,提供一种数据处理方法,应用于第一服务器,第一服务器归属于数据处理系统,数据处理系统还包括:第一请求端、至少一个第二请求端、第三请求端和第二服务器。一个请求端对应一个数据集。第一请求端的数据传输能力满足数据传输条件。该方法包括:接收来自第一请求端的多个第二打包值、来自第二请求端的多个第六打包值和来自第三请求端的多个第七打包值。第二打包值为第一请求端对第一数据集进行数据去除后的数据集进行打包得到的,第一数据集为第一请求端对应的数据集。第六打包值为第二请求端对第二数据集进行数据去除后的数据集进行打包得到的,第二数据集为第二请求端对应的数据集。第七打包值为第三请求端对第三数据集中的数据进行打包得到的,第三数据集为第三请求端对应的数据集。根据多个第二打包值、多个第六打包值、多个第七打包值,确定多个第四打包值。向第一请求端发送多个第四打包值,以使得第一请求端根据多个第四打包值确定第一数据集、第二数据集和第三数据集的交集中的数据数量。

12、在一种可能的实施方式中,第二打包值、第六打包值、第七打包值和第四打包值满足下述表达式:

13、k′c,q1,q2,...,qi,...qt,b

14、=h(e(uc,r(a1,q1))·e(uc,r(a2,q2))...e(uc,r(ai,qi))...

15、·e(uc,r(at,qt))e(uc,rb))

16、k′c,q1,q2,...,qi,...qt,b为第四打包值,h为哈希函数,e为双线性映射函数,uc为多个第七打包值中第c个第七打包值,r(ai,qi)为第ai个第二请求端发送的多个第六打包值中的第qi个第六打包值,t为至少一个第二请求端的数量,rb为多个第二打包值中的第b个第二打包值。

17、第四方面,提供一种数据处理方法,应用于第二服务器,第二服务器归属于数据处理系统,数据处理系统还包括:第一请求端、至少一个第二请求端、第三请求端和第一服务器。一个请求端对应一个数据集。第一请求端的数据传输能力满足数据传输条件。该方法包括:接收来自第一请求端的目标值、来自第三请求端的多个第八打包值。目标值为第一请求端根据第一打包值和第三打包值确定的,第一打包值为第一请求端对第一数据集进行打包得到的,第一数据集为第一请求端对应的数据集,第三打包值为第二请求端对第二数据集进行打包得到的,第二数据集为第二请求端对应的数据集。第八打包值为第三请求端对多个预设随机数进行打包得到的。根据目标值、多个第八打包值,确定多个第五打包值。向第一请求端发送多个第五打包值,以使得第一请求端根据多个第五打包值确定第一数据集、第二数据集和第三数据集的交集中的数据数量。第三数据集为第三请求端对应的数据集。

18、在一种可能的实施方式中,目标值、第八打包值和第五打包值满足下述表达式:

19、wm=h(e(tm,r))

20、wm为多个第八打包值中第m个第八打包值对应的第五打包值,h为哈希函数,e为双线性映射函数,tm为第m个第八打包值,r为目标值。m为小于或等于第三数据集中的数据数量的正整数。

21、第五方面,提供了一种数据处理装置用于实现上述各种方法。该数据处理装置可以为上述第一方面中的第一请求端,或者,为上述第二方面中的第三请求端,或者,为上述第三方面中的第一服务器,或者,为上述第四方面中的第二服务器。数据处理装置包括实现上述方法相应的模块或单元,该模块或单元可以通过硬件实现,软件实现,或者通过硬件执行相应的软件实现。该硬件或软件包括一个或多个与上述功能相对应的模块或单元。

22、在一些实施例中,该数据处理装置可以包括处理模块和通信模块。该通信模块,也可以称为通信单元,用以实现上述任一方面及其任意可能的实现方式中的发送和/或接收功能。该通信模块可以由通信电路,通信机,通信器或者通信接口构成。该处理模块,可以用于实现上述任一方面及其任意可能的实现方式中的处理功能。

23、在一些实施例中,通信模块包括发送模块和接收模块,分别用于实现上述任一方面及其任意可能的实现方式中的发送和接收功能。

24、第六方面,提供一种电子设备,包括:处理器。用于存储处理器可执行指令的存储器。其中,处理器被配置为执行指令,以实现上述第一方面及其任一种可能的实施方式的方法,或者,实现上述第二方面及其任一种可能的实施方式的方法,或者,实现上述第三方面及其任一种可能的实施方式的方法,或者,实现上述第四方面及其任一种可能的实施方式的方法。

25、第七方面,提供一种计算机可读存储介质,当计算机可读存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行上述第一方面及其任一种可能的实施方式的方法,或者,执行上述第二方面及其任一种可能的实施方式的方法,或者,执行上述第三方面及其任一种可能的实施方式的方法,或者,执行上述第四方面及其任一种可能的实施方式的方法。

26、第八方面,提供一种计算机程序产品,计算机程序产品包括计算机指令,当计算机指令在电子设备上运行时,使得电子设备执行上述第一方面及其任一种可能的实施方式的方法,或者,执行上述第二方面及其任一种可能的实施方式的方法,或者,执行上述第三方面及其任一种可能的实施方式的方法,或者,执行上述第四方面及其任一种可能的实施方式的方法。

27、本技术提供的第一方面的技术方案至少带来以下有益效果:现有技术对多个加密后的隐私数据集合求交集,运算量大,效率低。本技术根据第一数据集,确定第一打包值和多个第二打包值,并向第一服务器发送多个第二打包值。其中,第一数据集为第一请求端对应的数据集;第一打包值为:对第一数据集进行打包得到的;第二打包值为:对第一数据集进行数据去除后的数据集进行打包得到的;这样,可以将第一数据集打包成一个数值,提高后续确定交集中数据数量的效率。同时,将数据去除后的数据集进行打包,可以用于后续确定交集中的数据数量。

28、之后,将第一打包值与第二请求端发送的第三打包值相乘,得到目标值,并向第二服务器发送目标值;第三打包值为第二请求端对第二数据集进行打包得到的;第二数据集为第二请求端对应的数据集;这样,可以将第一请求端的第一数据集与至少一个第二请求端中每个第二请求端的第二数据集打包,能够有效提高后续确定交集中数据数量的效率。

29、进一步的,接收来自第一服务器的多个第四打包值和来自第二服务器的多个第五打包值,并根据多个第四打包值和多个第五打包值,确定第一数据集、第二数据集和第三数据集的交集中的数据数量;其中,第四打包值为第一服务器根据第一请求端发送的多个第二打包值、第二请求端发送的多个第六打包值和第三请求端发送的多个第七打包值确定的;第六打包值为第二请求端对第二数据集进行数据去除后的数据集进行打包得到的;第七打包值为第三请求端对第三数据集中的数据进行打包得到的;第三数据集为第三请求端对应的数据集;第五打包值为第二服务器根据第三请求端发送的多个第八打包值和目标值确定的;第八打包值为第三请求端对多个预设随机数进行打包得到的。

30、由于第七打包值为第三请求端对第三数据集中的数据进行打包得到的,通过第一请求端发送的多个第二打包值、第二请求端发送的多个第六打包值和第三请求端发送的多个第七打包值,可以将第三数据中的数据与进行数据去除后的第二数据集和进行数据去除后的第一数据集中进行打包。由于第五打包值为第二服务器根据第三请求端发送的多个第八打包值和目标值确定的,这样,可以将第一请求端的第一数据集与至少一个第二请求端中每个第二请求端的第二数据集打包后的数据再次进行处理。之后,通过多个第四打包值和多个第五打包值,可以高效确定第一数据集、第二数据集和第三数据集的交集中的数据数量。

31、需要说明的是,第二方面至第八方面中的任一种实现方式所带来的技术效果可参见第一方面中对应实现方式所带来的技术效果,此处不再赘述。

32、应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本技术。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1