本发明涉及网络安全,尤其涉及一种属于划分的可高效重构的个人隐私保护方法。
背景技术:
1、目前垂直数据分割的研究主要集中在将数据集按照给定的隐私限制分割为特定的子集,并满足提出的隐私设置;这些研究根据假设的威胁模型提出隐私设置,并通过属性分割计算方法来满足给定的隐私设置,在现有技术中隐私限制通常以属性的集合形式表示。
2、因此,现有技术在解决垂直数据分割的隐私保护问题时,存在以下问题:1、存在多服务器情况的处理困难:现有技术对于只涉及两个服务器的情况进行了研究,但在实际应用中,可能需要处理更多的服务器,多服务器情况下,数据的分割和隐私保护变得更加复杂,需要考虑不同服务器之间的协作和通信,而现有技术对此并没有给出明确的解决方案。2、需要额外的可信服务器:现有技术中一些方案依赖于额外的可信服务器来执行存储和查询任务,以保护数据的隐私。然而,引入可信服务器会增加网络查询的延迟和使用成本,对于大规模数据存储和查询的场景可能不太实用。3、依赖数据加密或可信服务器的算力:一些现有技术在数据存储和查询过程中使用了数据加密或可信服务器的算力。这可能会限制数据的重构和查询的灵活性,特别是在需要频繁进行查询或数据操作的场景中。
3、需要说明的是,在上述背景技术部分公开的信息只用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
1、本发明的目的在于克服现有技术的缺点,提供了一种基于属性划分的可高效重构的个人隐私保护方法,解决了现有方法存在的问题。
2、本发明的目的通过以下技术方案来实现:一种基于属性划分的可高效重构的个人隐私保护方法,所述个人隐私保护方法包括计算推断集步骤和属性分割步骤;
3、计算推断集步骤包括:通过机器学习方法对输入数据集进行推断集计算,并采用递归的方式在计算过程中将每次计算得到的推断集作为新的敏感属性集输入机器学习算法中学习,直到生成的推断集树收敛或达到设定层数;
4、属性分割步骤包括:确定允许泄露的服务器个数和总服务器个数的值,并将隐私设置转化为相应的约束表达式,并将约束表达式输入到sat求解器中通过sat求解器获得最终的属性分割结果。
5、所述计算推断集步骤具体包括以下内容:
6、初始化推断集树t,遍历属性集合的所有子集x后,通过机器学习算法l计算属性子集x的推断集y=l(x);
7、将推断集y作为新的敏感属性集s,即s=y,并判断是否满足结束条件;
8、如果生成的推断集y为空或者推断集树t的深度达到设定层数h时,则结束,并将推断集y添加到推断集树t中作为推断集树t的子节点;
9、重复上述步骤,继续遍历属性集合的下一个子集,直到完成属性集合中所有子集的遍历。
10、在初始化推断集树之前还需要输入数据集和敏感属性集合s={s1,s2,...,sm},其中si是敏感属性,数据集包括属性集合d={a1,a2,...,an}。
11、所述属性分割步骤具体包括以下内容:
12、确定隐私设置中的参数:确定最高允许泄露的服务器个数k和总服务器个数n的值;
13、构建约束表达式:构建约束表达式,将隐私设置转化为sat问题的约束;
14、将构建的约束表达式输入到sat求解器中,sat求解器通过求解约束表达式得到满足约束的属性分割方案;
15、输出sat求解器得到的属性分割方案,将各个属性分配到对应服务器中实现个人隐私保护。
16、所述约束包括:
17、约束一:每个属性必须分配到某一个服务器中;
18、约束二:否定所有隐私设置不允许发生的情况;
19、约束三:用户自设置的额外约束。
20、所述个人隐私保护方法还包括:在执行计算推断集步骤之前设置敏感属性集、推断集和安全模型;
21、设置敏感属性集包括:设是数据中属性的集合,敏感属性集
22、设置推断集包括:设是数据中属性的集合,数据集l是一种机器学习算法,如果p(l(u)=s)>v,那么u则是数据集中的推断集,p(l(u)=s)为数据集u到s的推断率,c为隐私保护强度;
23、设置安全模块包括:设是数据中属性的集合,有敏感属性集s,将分配到服务器{xi|i∈{1…n}}中,再选取k个服务器进行属性的合并表示数据集中的推断集,k<n。
24、本发明具有以下优点:一种基于属性划分的可高效重构的个人隐私保护方法,通过计算推断集算法和属性分割算法,实现了对敏感属性的隐私保护和分割,提高了数据隐私的安全性,采用sat求解器和约束表达式的方式,将属性分割问题转化为已经广泛研究的sat问题,提供了一种有效的解决思路,能够得到更优的属性分割方案,由于可高效重构,比使用传统方法进行查询操作平均耗时降低20%。
1.一种基于属性划分的可高效重构的个人隐私保护方法,其特征在于:所述个人隐私保护方法包括计算推断集步骤和属性分割步骤;
2.根据权利要求1所述的一种基于属性划分的可高效重构的个人隐私保护方法,其特征在于:所述计算推断集步骤具体包括以下内容:
3.根据权利要求2所述的一种基于属性划分的可高效重构的个人隐私保护方法,其特征在于:在初始化推断集树之前还需要输入数据集和敏感属性集合s={s1,s2,...,sm},其中si是敏感属性,数据集包括属性集合d={a1,a2,...,an}。
4.根据权利要求1所述的一种基于属性划分的可高效重构的个人隐私保护方法,其特征在于:所述属性分割步骤具体包括以下内容:
5.根据权利要求4所述的一种基于属性划分的可高效重构的个人隐私保护方法,其特征在于:所述约束包括:
6.根据权利要求1-5中任意一项所述的一种基于属性划分的可高效重构的个人隐私保护方法,其特征在于:所述个人隐私保护方法还包括:在执行计算推断集步骤之前设置敏感属性集、推断集和安全模型;