数据处理方法、装置、设备及存储介质与流程

文档序号:37157737发布日期:2024-02-26 17:22阅读:12来源:国知局
数据处理方法、装置、设备及存储介质与流程

本技术涉及通信,尤其涉及一种数据处理方法、装置、设备及存储介质。


背景技术:

1、对两个隐私集合求交集可以应用于计算广告转化率。现有技术通常是服务器接收第一请求端发送的加密后的第一隐私集合和第二请求端发送的加密后的第二隐私集合,确定加密后的第一隐私集合和加密后的第二隐私集合的交集中的数据数量。之后,服务器分别向第一请求端和第二请求端发送交集中的数据数量。

2、但是,服务器为了节省算力,可能导致确定到的交集中的数据数量有误。


技术实现思路

1、本技术提供一种数据处理方法、装置、设备及存储介质,以至少解决现有技术中服务器为了节省算力,可能导致确定到的交集中的数据数量有误的问题。本技术的技术方案如下:

2、第一方面,提供一种数据处理方法,应用于数据处理系统中的第一请求端,数据处理系统还包括第二请求端和服务器;一个客户端对应一个数据集;该方法包括:根据第一预设数值,确定多个第一随机数;根据多个第一随机数、第一数据集,确定第二数据集,并向服务器发送第二数据集;第一数据集为第一请求端对应的数据集;第二数据集包括:根据第二预设数值对多个第一随机数进行随机化后的数据,以及根据第二预设数值对第一数据集中的数据进行随机化后的数据;接收来自服务器发送的第三数据集;第三数据集为:根据第二数据集和第一多项式确定的;第一多项式为根据多个第一数据组合确定的;第i个第一数据组合包括第四数据集中的第i个数据和多个第二随机数中的第i个第二随机数;第四数据集中的数据为根据第二预设数值对第五数据集中的数据进行随机化后的数据;第五数据集中的第j个数据为第六数据集中的第j个数据,第五数据集中的第n+c个数据为多个第一随机数中的第c个数据;第六数据集为第二请求端对应的数据集;n为第六数据集中的数据数量;多个第二随机数为根据第三预设数值确定的;多个第二随机数的数量与第五数据集中的数据数量相同;根据第三预设数值确定多个第二随机数,并在第d个第二随机数归属于第三数据集的情况下,根据第三数据集和多个第二随机数,确定第一数据集和第六数据集的交集中的数据数量;d为大于n的正整数。

3、在一种可能的实施方式中,在根据第一预设数值,确定多个第一随机数后,上述方法还包括:根据至少一个哈希函数,将第一数据集中的数据映射至多个第七数据集;根据至少一个哈希函数,将多个第一随机数映射至多个第七数据集;确定与多个第七数据集一一对应的多个第八数据集,并向服务器发送多个第八数据集;第八数据集包括:根据第二预设数值对第七数据集中的数据进行随机化后的数据;接收来自服务器发送的第九数据集;第九数据集为:根据多个第八数据集和多个第二多项式确定的;多个第二多项式为根据多个第十数据集和多个第三随机数确定的;多个第十数据集为根据至少一个哈希函数对第五数据集中的数据进行处理得到的;多个第三随机数为根据第四预设数值确定的;多个第十数据集的数量与多个第七数据集的数量相同;根据第四预设数值确定多个第三随机数,并在第e个第三随机数归属于第九数据集的情况下,根据第九数据集和多个第三随机数,确定第一数据集和第六数据集的交集中的数据数量;e为大于多个第七数据集数量的正整数。

4、第二方面,提供一种数据处理方法,应用于数据处理系统中的第二请求端,数据处理系统还包括第一请求端和服务器;一个客户端对应一个数据集;该方法包括:根据第六数据集和多个第一随机数,确定第五数据集;第六数据集为第二请求端对应的数据集;多个第一随机数为根据第一预设数值确定的;第五数据集中的第j个数据为第六数据集中的第j个数据,第五数据集中的第n+c个数据为多个第一随机数中的第c个数据;n为第六数据集中的数据数量;根据第二预设数值对第五数据集中的数据进行随机化处理,得到第四数据集;根据第四数据集和多个第二随机数,确定多个第一数据组合;多个第二随机数为根据第三预设数值确定的;第i个第一数据组合包括第四数据集中的第i个数据和多个第二随机数中的第i个第二随机数;多个第二随机数的数量与第四数据集中的数据数量相同;根据多个第一数据组合,确定第一多项式,并向服务器发送第一多项式,以使得服务器根据第一多项式确定第三数据集;第三数据集用于确定第一数据集和第六数据集的交集中的数据数量;第一数据集为第一请求端对应的数据集。

5、在一种可能的实施方式中,在根据第六数据集和多个第一随机数,确定第五数据集后,上述方法还包括:根据至少一个哈希函数,将第五数据集中的数据映射至多个第十数据集;根据第四预设数值,确定多个第三随机数;多个第三随机数的数量与多个第十数据集的数量和多个第一随机数的数量之和相同;多个第十数据集中的第f个第十数据集与多个第三随机数的第f个第三随机数对应;针对每个第十数据集,在第十数据集中的数据为根据第六数据集中的数据映射得到的情况下,根据第十数据集中的数据和第十数据集对应的第三随机数,确定第十数据集对应的第十一数据集;在第十数据集中的数据为根据多个第一随机数中的第g个第一随机数映射得到的情况下,根据第十数据集的数据和多个第三随机数中的第g个第三个随机数,确定第十数据集对应的第十二数据集;根据第十数据集对应的第十一数据集和第十数据集对应的第十二数据集,确定第十数据集对应的第二多项式,以得到多个第二多项式;向服务器发送多个第二多项式,以使得服务器根据多个第二多项式确定第十三数据集;第十三数据集用于确定第一数据集和第六数据集的交集的数据数量。

6、第三方面,提供一种数据处理方法,应用于数据处理系统中的服务器,数据处理系统还包括第一请求端和第二请求端;一个客户端对应一个数据集;该方法包括:接收来自第一请求端发送的第二数据集;第二数据集包括:根据第二预设数值对多个第一随机数进行随机化后的数据,以及根据第二预设数值对第一数据集中的数据进行随机化后的数据;多个第一随机数为根据第一预设数值确定的;第一数据集为第一请求端对应的数据集;接收来自第二请求端发送的第一多项式;第一多项式为根据多个第一数据组合确定的;第i个第一数据组合包括第四数据集中的第i个数据和多个第二随机数中的第i个第二随机数;第四数据集中的数据为根据第二预设数值对第五数据集中的数据进行随机化后的数据;第五数据集中的第j个数据为第六数据集中的第j个数据,第五数据集中的第n+c个数据为多个第一随机数中的第c个数据;第六数据集为第二请求端对应的数据集;n为第六数据集中的数据数量;多个第二随机数为根据第三预设数值确定的;多个第二随机数的数量与第四数据集中的数据数量相同;将第二数据集中的数据输入第一多项式,得到第三数据集;向第一请求端发送第三数据集,以使得第一请求端根据第三数据集,确定第一数据集和第六数据集的交集中的数据数量。

7、在一种可能的实施方式中,上述方法还包括:接收来自第一请求端发送的多个第八数据集;第八数据集包括:根据第二预设数值对第七数据集中的数据进行随机化后的数据;第七数据集包括:根据至少一个哈希函数,将第一数据集中的数据映射得到的数据,以及根据至少一个哈希函数,将多个第一随机数映射得到的数据;接收来自第二请求端发送的多个第二多项式;多个第二多项式为根据多个第十数据集和多个第二随机数确定的;多个第十数据集为根据至少一个哈希函数对第五数据集中的数据进行处理得到的;根据多个第八数据集和多个第二多项式,确定第九数据集,并向第一请求端发送第九数据集,以使得第一请求端根据第九数据集确定第一数据集和第六数据集的交集中的数据数量。

8、第四方面,提供了一种数据处理装置用于实现上述各种方法。该数据处理装置可以为上述第一方面中的第一请求端,或者,为上述第二方面中的第二请求端,或者,为上述第三方面中的服务器。数据处理装置包括实现上述方法相应的模块或单元,该模块或单元可以通过硬件实现,软件实现,或者通过硬件执行相应的软件实现。该硬件或软件包括一个或多个与上述功能相对应的模块或单元。

9、在一些实施例中,该数据处理装置可以包括处理模块和通信模块。该通信模块,也可以称为通信单元,用以实现上述任一方面及其任意可能的实现方式中的发送和/或接收功能。该通信模块可以由通信电路,通信机,通信器或者通信接口构成。该处理模块,可以用于实现上述任一方面及其任意可能的实现方式中的处理功能。

10、在一些实施例中,通信模块包括发送模块和接收模块,分别用于实现上述任一方面及其任意可能的实现方式中的发送和接收功能。

11、第五方面,提供一种电子设备,包括:处理器。用于存储处理器可执行指令的存储器。其中,处理器被配置为执行指令,以实现上述第一方面及其任一种可能的实施方式的方法,或者,实现上述第二方面及其任一种可能的实施方式的方法,或者,实现上述第三方面及其任一种可能的实施方式的方法。

12、第六方面,提供一种计算机可读存储介质,当计算机可读存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行上述第一方面及其任一种可能的实施方式的方法,或者,执行上述第二方面及其任一种可能的实施方式的方法,或者,执行上述第三方面及其任一种可能的实施方式的方法。

13、第七方面,提供一种计算机程序产品,计算机程序产品包括计算机指令,当计算机指令在电子设备上运行时,使得电子设备执行上述第一方面及其任一种可能的实施方式的方法,或者,执行上述第二方面及其任一种可能的实施方式的方法,或者,执行上述第三方面及其任一种可能的实施方式的方法。

14、本技术提供的第一方面的技术方案至少带来以下有益效果:现有技术是服务器确定加密后的第一隐私集合和加密后的第二隐私集合的交集中的数据数量,但是为了节省算力,可能导致确定到的交集中的数据数量有误。本技术根据多个第一随机数、第一数据集,确定第二数据集,并向服务器发送第二数据集。其中,第一数据集为第一请求端对应的数据集。第二数据集包括:根据第二预设数值对多个第一随机数进行随机化后的数据,以及根据第二预设数值对第一数据集中的数据进行随机化后的数据。这样,向服务器发送的第二数据集中包括对多个第一随机数随机化后的数据。

15、之后,接收来自服务器发送的第三数据集。其中,第三数据集为:根据第二数据集和第一多项式确定的。第一多项式为根据多个第一数据组合确定的。第i个第一数据组合包括第四数据集中的第i个数据和多个第二随机数中的第i个第二随机数。第四数据集中的数据为根据第二预设数值对第五数据集中的数据进行随机化后的数据。由于第五数据集中的第j个数据为第六数据集中的第j个数据,第五数据集中的第n+c个数据为多个第一随机数中的第c个数据。第六数据集为第二请求端对应的数据集。这样,能够根据第一多项式和多个第一随机数随机化后的数据确定多个第一随机数随机化后的数据对应的第二随机数。

16、进一步的,根据第三预设数值确定多个第二随机数,并在第d个第二随机数归属于第三数据集的情况下,根据第三数据集和多个第二随机数,确定第一数据集和第六数据集的交集中的数据数量。在第d个第二随机数归属于第三数据集的情况下,表明服务器确定的第三数据集无误,从而可以准确确定第一数据集和第六数据集的交集中的数据数量。

17、需要说明的是,第二方面至第七方面中的任一种实现方式所带来的技术效果可参见第一方面中对应实现方式所带来的技术效果,此处不再赘述。

18、应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本技术。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1