传感器网络中基于多维分解的隐私数据汇聚方法_2

文档序号:9866084阅读:来源:国知局
t对应的原始监测值Xt,并将其分解成d维数据,由此Λ·;可W表示为
[0046]
0)
[0047] 其中,皆是原始监测值Xt的第i维分量,bW是第i维的维度权重。
[004引St邱3数据扰动:参考图1,根据各维度上的局部敏感度Si和隐私预算ε,生成d个满 足ε-差分隐私且相互独立的噪声分量,<服从概率密度函数为表达式(4)的拉普拉斯分 布:
[0049]
(4)
[0050] 其中,η为噪声变量,参数λ由相应维度上的局部敏感度Si和隐私预算ε共同确定, 即J = 在实际应用中可W使用几何分布、高斯分布等随机分布函数替换拉普拉斯分布, ε 同样能够取得预期效果;
[0化1]各维上的噪声化结果y;的表达式为
[00 对
(5)
[0053] 其中,為是原始监测值Xt的第i维分量,η;是相应维度上的噪声分量;
[0054] St邱4隐私汇聚:当时隙t = 0时,各维汇聚结果fc:为0;当时隙t〉0时,根据上一时隙 的第i维的汇聚结果Γ/_ι和当前时隙第i维的噪声化结果乂'得到各维隐私保护的汇聚结果r/ 为
[0化5]
巧)
[0056] steps数据合成与发布:参考图2,经过Step4的隐私计算后,按照不同的维度权重 对各维噪声化结果《进行综合得到对外发布的汇聚结果Rt(汇聚目标可W是求和或计数) 为
[0057]
口)
[005引其中,bi-1表示第i维的维度权重Wi;
[0059] 从发布的汇聚结果还原出隐私保护后监测值Yt为
[0060] Yt = Rt-Rt-i (8)
[0061] 参考图3,给定全局敏感度范围g为2到2000之间的整数,隐私预算为ε = 2,随机选 取维度基数b分别为3、8和1000,本发明中使用的多维分解噪声机制生成噪声的方差相比普 通拉普拉斯噪声机制生成噪声的方差普遍较小,而小的噪声方差可W带来更好的数据效用 性,说明本发明中多维分解噪声机制相比现有机制在效用性上具有优越性。
[0062] 参考图4,给定相同的全局敏感度g为4083,随着隐私预算ε的增大,多维分解数据 汇聚和普通拉普拉斯数据汇聚产生的平均相对误差逐渐降低。运反映了差分隐私的性质, 隐私性和效用性存在折衷,即隐私预算越小,数据隐私性越好,而数据效用性越低,反之亦 然。随机选取维度基数b为2和2042,给定相同隐私预算,多维分解数据汇聚产生的平均相对 误差比普通拉普拉斯数据汇聚要低,运反映了本发明中多维分解数据汇聚能够带来更好的 效用性。
[0063] 在实际应用中可W利用多维分解的特性集成级联缓冲计数方法提高汇聚过程的 性能。
【主权项】
1. 传感器网络中基于多维分解的隐私数据汇聚方法,其特征在于,首先对每个时隙产 生的监测数据添加由多维分解噪声机制生成的噪声,然后利用生成的数据进行隐私数据汇 聚,具体包括以下步骤: Stepl初始化:给定维度基数b和全局敏感度g,计算维度数d,计算各维度上的局部敏感 度Si,其中i = l,2,…,d是分解后的维度; Step2数据获取与分解:通过底层硬件设备直接获取监测数据,得到每个时隙t对应的 原始监测值Xt,并将其分解成d维数据4 Step3数据扰动:根据各维度上的局部敏感度Sl和隐私预算ε,生成d个服从拉普拉斯分 布且相互独立的噪声分量 <,并将其添加到形成噪声化结果 Step4隐私汇聚:结合上一时隙的d维汇聚结果^和当前时隙的d维噪声化结果W,得到 当前时隙的d维汇聚结果 Step5数据合成与发布:按照不同的维度权重对各维噪声化结果 < 进行综合得到并对外 发布隐私保护的汇聚结果Rt。2. 根据权利要求1所述的传感器网络中基于多维分解的隐私数据汇聚方法,其特征在 于,Stepl的具体操作为:设维度基数b是大于等于2的自然数、全局敏感度g是监测数据的最 大估计值,维度数d的表达式为 ^ = L1〇a/.^J+1 (Π 各维度上的局部敏感度Si的表达式为(2) 其中,表达式(2)表示在较低维i = l,2, . . .,d-l上的局部敏感度为b-Ι,而在最高维i = d上敏感度通过维度基数b、全局敏感度g和维度数d共同确定。3. 根据权利要求1所述的传感器网络中基于多维分解的隐私数据汇聚方法,其特征在 于,St印2中原始监测值Xt为:(3) 其中,4是原始监测值Xt的第i维分量,b1-1是第i维的维度权重。4. 根据权利要求1所述的传感器网络中基于多维分解的隐私数据汇聚方法,其特征在 于,SteP3的具体操作为:生成d个满足ε-差分隐私且相互独立的噪声分量《;:,要求《丨服从概 率密度函数为式(4)拉普拉斯分布:(4) 其中,η为噪声变量,参数λ由相应维度上的局部敏感度Sl和隐私预算ε共同确定,gp ε (5) 各维上的噪声化结果 >,丨的表达式为 其中,4是原始监测值Xt的第i维分量,<是相应维度上的噪声分量。5. 根据权利要求1所述的传感器网络中基于多维分解的隐私数据汇聚方法,其特征在 于,Step4得到各维隐私保护的汇聚结果 <为(6) 其中,是上一时隙的第i维的汇聚结果,时隙t = 0时各维汇聚结果^为0。6. 根据权利要求1所述的传感器网络中基于多维分解的隐私数据汇聚方法,其特征在 于,SteP5的具体操作为,按照不同的维度权重^对各维噪声化结果?进行综合得到对外发 布的汇聚结果Rt为(7) 其中,bH表示第i维的维度权重Wi; 从发布的汇聚结果还原出隐私保护后监测值Yt为 Yt = Rt_Rt-1 (8)〇
【专利摘要】本发明公开了一种传感器网络中基于多维分解的隐私数据汇聚方法。在传感器网络中,一般基于拉普拉斯噪声机制的差分隐私方法可能会因为较大的全局敏感度造成过扰动现象,从而破坏汇聚数据的效用性。本发明提出的方法通过将单一数据流分解为指数权重的多维数据流,并在每一维数据流上根据每一维的局部敏感度和隐私预算添加独立噪声实现差分隐私保护。相比于一般的拉普拉斯噪声机制下的汇聚过程,该方法在保证相同程度用户隐私的同时提供更好的数据效用性。
【IPC分类】G06F21/62
【公开号】CN105631360
【申请号】CN201610005312
【发明人】杨新宇, 任雪斌, 蔺杰, 王路辉, 李庄园, 王腾, 赵聪
【申请人】西安交通大学
【公开日】2016年6月1日
【申请日】2016年1月6日
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1