一种数据处理方法、装置、设备和存储介质与流程

文档序号:37541276发布日期:2024-04-08 13:40阅读:10来源:国知局
一种数据处理方法、装置、设备和存储介质与流程

本发明实施例涉及数据处理,尤其涉及一种数据处理方法、装置、设备和存储介质。


背景技术:

1、目前,随着大数据云计算的时代到来,信息时代随时都充满着各式各样的数据。在数据应用场景中,需要在不泄露目标数据的前提下确定目标数据对应的统计信息。

2、本地差分隐私(local differential privacy,ldp)是由差分隐私算法延伸而来的一种隐私保护算法,可在保护目标数据的前提下对目标数据进行采集与分析。ldp的数据保护程度与算法的隐私预算等级有关,隐私预算等级越低表示数据保护程度越高,反之亦然。因此,现有技术可以基于隐私预算等级对目标数据进行保护,在不泄露目标数据的情况下实现对目标数据的统计分析。

3、在实现本发明的过程中,发明人发现现有技术中至少存在以下技术问题:

4、现有技术仅可以提供唯一的隐私预算等级对目标数据进行保护,无法为不同对象的数据提供不同的保护程度。


技术实现思路

1、本发明提供一种数据处理方法、装置、设备和存储介质,为不同目标数据提供不同的数据保护程度,在不泄露目标数据的情况下实现对目标数据的统计分析。

2、第一方面,本发明实施例提供了一种数据处理方法,包括:

3、获取各目标数据,根据各所述目标数据对应的隐私预算等级将各所述目标数据转换为扰动数据;

4、根据转换结果确定各所述隐私预算等级对应的扰动数据和补充数据;

5、基于各所述隐私预算等级对应的扰动数据、补充数据、以及扰动数据和补充数据的总数据量,确定各所述隐私预算等级对应的数据均值;

6、根据各所述隐私预算等级、各所述隐私预算等级对应的数据均值以及扰动数据的数据量,确定所述目标数据的均值。

7、第二方面,本发明实施例还提供了一种数据处理装置,包括:

8、获取模块,用于获取各目标数据,根据各所述目标数据对应的隐私预算等级将各所述目标数据转换为扰动数据;

9、第一确定模块,用于根据转换结果确定各所述隐私预算等级对应的扰动数据和补充数据;

10、第二确定模块,用于基于各所述隐私预算等级对应的扰动数据、补充数据、以及扰动数据和补充数据的总数据量,确定各所述隐私预算等级对应的数据均值;

11、均值确定模块,用于根据各所述隐私预算等级、各所述隐私预算等级对应的数据均值以及扰动数据的数据量,确定所述目标数据的均值。

12、第三方面,本发明实施例还提供了一种计算机设备,所述计算机设备包括:

13、至少一个处理器;以及与所述至少一个处理器通信连接的存储器;

14、其中,所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行第一方面中任一项所述的数据处理方法。

15、第四方面,本发明实施例还提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行第一方面中任一所述的数据处理方法。

16、上述发明中的实施例具有如下优点或有益效果:

17、本发明实施例提供一种数据处理方法,包括:获取各目标数据,根据各所述目标数据对应的隐私预算等级将各所述目标数据转换为扰动数据;根据转换结果确定各所述隐私预算等级对应的扰动数据和补充数据;基于各所述隐私预算等级对应的扰动数据、补充数据、以及扰动数据和补充数据的总数据量,确定各所述隐私预算等级对应的数据均值;根据各所述隐私预算等级、各所述隐私预算等级对应的数据均值以及扰动数据的数据量,确定所述目标数据的均值。上述技术方案,首先可以获取各目标数据,并基于各目标数据的隐私预算等级,将各目标数据转换为扰动数据,实现根据目标数据的隐私预算等级对目标数据进行不同程度的加噪,实现对各目标数据的多级别本地差分隐私保护,满足不同目标数据的数据保护需求,其次可以根据转换结果统计各隐私预算等级对应的扰动数据和补充数据,进而可以基于各隐私预算等级对应的扰动数据、补充数据、以及扰动数据和补充数据的总数据量,求取各隐私预算等级对应的数据均值,由于各隐私预算等级对应的补充数据扩充了用于计算各隐私预算等级的数据量,使计算得到的各隐私预算等级对应的数据均值更加精确,进一步可以根据各隐私预算等级所对应扰动数据的数据量对各隐私预算等级对应的数据均值进行加权平均,提升确定的加权平均值的准确度,对加权平均值进行反归一化处理,得到目标数据的均值,降低了数据统计误差。



技术特征:

1.一种数据处理方法,其特征在于,包括:

2.根据权利要求1所述的数据处理方法,其特征在于,获取各目标数据,包括:

3.根据权利要求2所述的数据处理方法,其特征在于,在根据各所述目标数据对应的隐私预算等级将各所述目标数据转换为扰动数据之前,还包括:

4.根据权利要求1所述的数据处理方法,其特征在于,根据各所述目标数据对应的隐私预算等级将各所述目标数据转换为扰动数据,包括:

5.根据权利要求4所述的数据处理方法,其特征在于,在根据扰动参数构建的离散数据集中确定所述归一目标数据对应的离散目标数据,包括:

6.根据权利要求4所述的数据处理方法,其特征在于,对所述离散目标数据进行数据扰动,以根据所述高概率数据集中的数据或者所述离散数据集中的其他数据,确定所述目标数据对应的所述扰动数据,包括:

7.根据权利要求1所述的数据处理方法,其特征在于,根据转换结果确定各所述隐私预算等级对应的扰动数据和补充数据,包括:

8.根据权利要求7所述的数据处理方法,其特征在于,对各所述储备数据进行二次加噪,得到所述目标隐私预算等级对应的补充数据,包括:

9.根据权利要求1所述的数据处理方法,其特征在于,在基于各所述隐私预算等级对应的扰动数据、补充数据、以及扰动数据和补充数据的总数据量,确定各所述隐私预算等级对应的数据均值之前,还包括:

10.根据权利要求1所述的数据处理方法,其特征在于,基于各所述隐私预算等级对应的扰动数据、补充数据、以及扰动数据和补充数据的总数据量,确定各所述隐私预算等级对应的数据均值,包括:

11.根据权利要求1所述的数据处理方法,其特征在于,根据各所述隐私预算等级、各所述隐私预算等级对应的数据均值以及扰动数据的数据量,确定所述目标数据的均值,包括:

12.一种数据处理装置,其特征在于,包括:

13.一种计算机设备,其特征在于,所述计算机设备包括:

14.一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-11中任一所述的数据处理方法。


技术总结
本发明实施例公开了一种数据处理方法、装置、设备和存储介质,该方法包括:获取各目标数据,根据各目标数据的隐私预算等级将各目标数据转换为扰动数据;根据转换结果确定各隐私预算等级对应的扰动数据和补充数据;基于各隐私预算等级对应的扰动数据、补充数据,以及扰动数据和补充数据的总数据量,确定各隐私预算等级对应的数据均值;根据各隐私预算等级、各隐私预算等级对应的数据均值以及扰动数据的数据量,确定目标数据的均值。上述技术方案,实现对目标数据进行不同程度的加噪,满足不同目标数据的数据保护需求,补充数据扩充了数据量,确定的数据均值更加精确,通过数据均值确定的目标数据的均值也更加准确,降低数据统计误差。

技术研发人员:孙林,王畅,伍星,孙小朋
受保护的技术使用者:北京沃东天骏信息技术有限公司
技术研发日:
技术公布日:2024/4/7
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1