一种边缘计算数据隐私保护方法与流程

文档序号:34361034发布日期:2023-06-04 17:01阅读:163来源:国知局
一种边缘计算数据隐私保护方法与流程

本发明涉及数据安全,具体涉及一种边缘计算数据隐私保护方法。


背景技术:

1、近年来,随着物联网的快速发展和4g/5g网络的普及,万物互联的时代已经到来,网络边缘设备的爆炸式增加使得传统的以云为核心的集中式大数据处理已经无法高效处理边缘设备所产生的数据。因此,以边缘计算模型为核心的边缘式大数据处理应运而生,成为了下一代网络的新的研究热点。简单来说,边缘计算是云计算向边缘的延伸,相对于经典云计算带来的“云端”的海量计算能力,边缘计算实现了资源和服务向边缘位置的下沉,从而能够降低交互时延、减轻网络负担、丰富业务类型、优化服务处理,提升服务质量和用户体验。具体来说,边缘计算利用更贴近用户或终端设备的网络资源,比如参与计算的设备可以是路由器、服务器甚至是终端设备。边缘计算可以说是分布式计算的一种,对于不同的计算任务,边缘节点可以实现相互协作,并行处理。

2、然而,边缘计算中的计算资源可能有不同种类的设备,如计算机、物联网设备、不同服务商提供的边缘服务器等。边缘计算中的计算资源的异构特性给边缘计算带来了巨大挑战,主要体现在:边缘计算中,计算过程从用户或者云迁移到边缘节点这一过程容易出现数据泄露,给边缘计算数据的隐私性带来了很大的安全隐患。因此,如何实现边缘计算数据的隐私保护以保证边缘计算数据的安全性,变得尤为重要。


技术实现思路

1、本发明主要是为了解决边缘计算设备容易出现信息泄露,导致边缘计算数据安全性存在隐患的问题,提供了一种边缘计算数据隐私保护方法,首先采用基于信息熵抑制的数据消冗方法对边缘计算数据进行消冗,去除重复数据,提高了边缘计算数据的质量;然后采用基于树模型的差分隐私保护算法对边缘计算数据进行隐私保护,显著降低了边缘计算数据的信息泄露比,实现边缘计算数据的安全处理;通过隐私保护,边缘计算数据的安全性得到了明显提升。

2、为了实现上述目的,本发明采用以下技术方案。

3、一种边缘计算数据隐私保护方法,包括以下步骤:

4、步骤s1:采用基于信息熵抑制的数据消冗方法对边缘计算数据进行消冗,去除重复数据;步骤s2:采用基于树模型的差分隐私保护算法对边缘计算数据进行隐私保护,实现安全处理;本发明提供了一种边缘计算数据隐私保护方法,首先采用基于信息熵抑制的数据消冗方法对边缘计算数据进行消冗,去除重复数据,提高边缘计算数据质量;然后采用基于树模型的差分隐私保护算法对边缘计算数据进行隐私保护,实现边缘计算数据的安全处理。本发明显著降低了边缘计算数据的信息泄露比,明显提升了边缘计算数据的安全性。

5、作为优选,步骤s1中,所述信息熵抑制公式表示为:

6、

7、其中,f为最优信息熵函数的数量;q为边缘计算数据映射至n位数组后的值;n为边缘计算数据的数组位数,即数据量;m为边缘计算数据的集合数量;

8、信息熵可以用来判断边缘计算数据的不确定性,在边缘计算数据的隐私保护中,使用信息熵抑制的模式,可以去除重复的数据,获取质量较好的数据信息,提高边缘计算数据处理效率。

9、作为优选,步骤s1中,消冗后的边缘计算数据集合f为:

10、

11、其中,h表示递归次数;

12、本发明为了加快数据安全处理的速度,对边缘计算数据进行消冗,优化边缘计算数据质量。

13、作为优选,步骤s2中,在面向树的差分隐私保护算法里,通过指数机制处理边缘计算数据集合f中的连续类数据特征;通过拉普拉斯机制处理边缘计算数据集合f中的离散类数据特征。

14、作为优选,步骤s2的具体过程,包括以下步骤:

15、步骤s21:选取最优分裂特征时,如果边缘计算数据集合f中存在连续类数据特征,则将隐私保护预算均分至各个连续类数据特征之中;

16、步骤s22:通过指数机制选取最优连续类数据特征和分裂点,并运算相应的基尼指数;

17、步骤s23:将边缘计算数据集合f中每个离散类数据特征通过差异的分裂模式实施分裂,并运算相应的基尼指数;

18、步骤s24:将步骤s23运算获得的基尼指数与步骤s22运算获得的基尼指数进行对比,获取基尼指数最低的分裂特征和分裂点,将其设成最优分裂特征;

19、步骤s25:将目前节点分裂成2个节点后循环步骤s21-s24,直至算法中的隐私保护预算被消耗完毕;

20、面向随机森林的差分隐私保护算法使用上述步骤中的最佳分裂选取方案,建立一个cart决策树,实现边缘计算数据集的拟合。通过等差隐私预算分配机制,将传统的逐层平均分配隐私预算的模式转化为等差分配模式。

21、作为优选,步骤s2包括基于cart决策树的差分隐私保护和基于随机森林的差分隐私保护。本发明基于树模型的差分隐私保护算法使用cart决策树设计边缘计算数据差分隐私保护机制,通过cart决策树所构建的随机森林和差分隐私算法相结合,设计了基于树模型的差分隐私保护算法。

22、作为优选,所述基于cart决策树的差分隐私保护的具体过程,包括以下步骤:

23、步骤a1:设置差分隐私预算为σ;

24、步骤a2:根据等差隐私预算分配机制,把预算分配至每个层级,若处于决策树的第j层时,分配至此层每个边缘计算数据节点的隐私预算为σi,之后将各个节点分配至隐私运算二等分;步骤a3:循环流程,满足停止条件时停止;

25、步骤a4:运算剩余每个离散类数据特征对边缘计算数据集合f的基尼指数,并与局部最佳特征的基尼指数实施比较,选择全局最佳分裂特征实现节点分裂;

26、步骤a5:如果不存在连续类数据特征,直接运算每个连续类数据特征对边缘计算数据集合f的基尼指数,并获取最佳分裂点对目前节点实施分裂;

27、其中,输入包括:边缘计算数据集合f、差分隐私预算σ、决策树最大深度λ;输出为:满足差分隐私预算σ-差分隐私保护的cart决策树;停止条件为:决策树的深度达到最大深度λ。

28、作为优选,步骤a3中,所述流程的具体过程,包括以下步骤:

29、步骤a1:如果边缘计算数据节点中的数据特征符合停止条件,则将此节点设为叶子节点,不再建立分节点,同时使用拉普拉斯机制对数据实施加噪,选择边缘计算数据集合f中最多的数据类型设成叶子节点的编码;

30、步骤a2:如果边缘计算数据节点中的数据特征不符合停止条件,便运算此节点具备的数据量,并通过拉普拉斯机制将其引入噪声;

31、步骤a3:如果边缘计算数据集合f中存在一个以上连续类数据特征,则将隐私保护预算均分至各个特征里,通过指数机制在全部的连续类数据特征中选取最优的分裂特征与分裂点。

32、作为优选,所述基于随机森林的差分隐私保护的具体过程,包括以下步骤:

33、步骤b1:将差分隐私预算σ均分至各个决策树中;

34、步骤b2:根据等差隐私预算分配机制,把预算分配至每个层级,如果处于决策树的第j层时,此层每个节点被分配的隐私预算σj为:

35、

36、步骤b3:将各个决策树实施处理。

37、作为优选,步骤b3中,所述处理的具体过程,包括以下步骤:

38、步骤b1:在训练边缘计算数据集合f中以放回的模式提取等量的数据;

39、步骤b2:如果边缘计算数据节点中的数据符合停止条件,便把此节点设成叶子节点,不再建立分节点,并通过拉普拉斯机制将节点的计数值引入噪声,之后选择样本中某类型数据最多的类型设成叶子节点的编码;

40、步骤b3:在边缘计算数据集合f中任意选择数据,如果子数据集中存在连续类数据特征,便进入后续步骤,反之停止;

41、步骤b4:将隐私保护预算均分至各个数据特征中,通过指数机制在全部的连续类数据特征中选取最优分裂特征与分裂模式;

42、步骤b5:运算剩余每个离散类数据特征的基尼指数,并与局部最佳特征的基尼指数实施比较,选择全局最佳分裂特征,再次将边缘计算数据节点实施分裂,实现数据隐私保护。

43、因此,本发明的优点是:

44、(1)采用基于信息熵抑制的数据消冗方法对边缘计算数据进行消冗,去除重复数据,获取质量较好的数据信息,提高边缘计算数据处理效率;

45、(2)采用基于树模型的差分隐私保护算法对边缘计算数据进行隐私保护,显著降低了边缘计算数据的信息泄露比,实现边缘计算数据的安全处理;

46、(3)通过隐私保护,明显提升了边缘计算数据的安全性。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1