智能电网中同时具有隐私保护和负载均衡的数据汇聚方法与流程

文档序号:17320994发布日期:2019-04-05 21:32阅读:341来源:国知局
智能电网中同时具有隐私保护和负载均衡的数据汇聚方法与流程

本发明属于隐私保护领域,具体涉及一种智能电网中同时具有隐私保护和负载均衡的数据汇聚方法。



背景技术:

现代社会,人们的用电需求以及对能源的创新需求不断提升,同时科学技术也在迅猛地发展,利用先进电子通信技术满足社会需求的智能电网应运而生。随着国家对下一代电网的重视,大量的人力与财力被投入到智能电网的研究与发展中。通过智能电表获得用户的用电数据,可以进行用电负载的实时监测,从而供电公司可以更好地调度电能,为了达到实时监测需要不断地收集用户的用电量数据,而这些数据如果泄露就会暴露个人用户的用电规律和生活习惯,比如根据用户的电表数据可以分析出用户的生活作息,甚至是用户的工作属性等。随着研究的不断深入,智能电网中丰富的各类数据信息暴露出了许多安全和隐私问题,在保证智能电网能够正常运行的同时保护用户的隐私安全显得尤为重要。

针对智能电网中数据聚合问题,随着本地隐私保护的概念被提出,可以从用户端进行隐私保护处理提供更可靠的隐私保护。然而数据汇聚过程除了需要保护数据的隐私,同时还面临另外一个挑战:邻域网中大量用户数据需通过逐跳传输的方式最终汇聚到服务器端,而直接利用传统的多跳转发方法,用户节点会面临通讯负载不均衡问题,从而降低网络寿命。现阶段,人们更加关注如何用更小的代价完成感知数据的汇聚,因此本发明基于压缩感知技术和本地隐私保护技术实现隐私保护的数据汇聚,同时降低系统整体传输负载,支持各个节点的传输负载均衡。



技术实现要素:

本发明的目的是同时解决在智能电网邻域网中传输负载问题和用户数据隐私泄露问题,提出了一种智能电网中同时具有隐私保护和负载均衡的数据汇聚方法,该方法在保证用户数据隐私的情况下,能够降低系统的整体传输负载,同时达到各个用户节点的传输负载均衡。本发明简单且易于实现,无需复杂运算或加密,具有极低的开销。

为达到上述目的,本发明采用如下的技术方案来实现的:

智能电网中同时具有隐私保护和负载均衡的数据汇聚方法,首先对每个用户产生的敏感数据利用随机化应答技术进行扰动,同时利用压缩感知技术对数据进行压缩传输,最后利用重构恢复算法进行隐私数据汇聚,具体包括以下步骤:

1)用户智能电表端处理:用户的智能电表正常工作过程,包括智能电表用户用电数据测量,用电数据离散化处理,用电数据随机化扰动,加权数据生成和用电传输数据生成,具体包括以下步骤,

1-1)用电数据测量:根据需求测量第i个用户智能电表的真实用电数据ei,测量得到的数据并不直接传输;

1-2)用电数据离散化处理:参考现在的“阶梯式电价”的方式,将用户用电数据ei离散化设置为di,此时的数据也不直接传输;

1-3)用电数据随机化扰动:根据隐私预算ε计算出随机化映射向量其中k表示离散数据种类,用户数据di根据随机化映射概率随机映射得到扰动数据

1-4)加权数据生成:根据服务器广播的种子生成一组服从对称伯努利分布的m个随机数,并构成向量通过计算生成加权数据

1-5)用电传输数据生成:当前用户的加权数据为来自上一用户的数据为通过计算生成当前的压缩传输数据

2)服务器端处理:电力公司服务器收到用户的压缩汇聚数据后,进行自适应字典训练和计算汇聚数据集,具体包括以下步骤,

2-1)自适应字典训练:根据服务器的历史数据信息,利用k-svd算法获得自适应的稀疏表示字典此步骤能够离线完成;

2-2)计算汇聚数据集:电力公司服务器收到用户的压缩汇聚数据后,根据重构恢复算法得到最终的各用户汇聚数据集

本发明进一步的改进在于,步骤1-3)的具体操作为:首先根据隐私预算ε计算出随机化映射向量pi,即共k个元素,其中k表示离散数据种类数,随机化映射向量各元素表示数据映射为其他数据的概率,各元素和为1,然后用户用电数据di根据随机化映射概率随机映射得到扰动数据

本发明进一步的改进在于,步骤1-4)中此时用户的扰动后数据为智能电表根据服务器广播的种子生成一组服从对称伯努利分布的m个随机数,并构成向量然后通过计算生成加权数据

本发明进一步的改进在于,步骤1-5)的具体操作为:第1个用户的加权数据为x1,生成的压缩传输数据y1=x1,传输到下一用户,第i个用户的加权数据为xi,与第i-1个用户的压缩传输数据yi-1相加,生成当前的压缩传输数据yi,即yi=yi-1+xi,传输到下一用户,逐跳传输直到生成第n个用户的压缩传输数据yn,传输到电力公司服务器端,其中n表示整体用户数。

本发明进一步的改进在于,步骤2-1)的具体操作为:电力公司服务器根据历史数据得到各数据的统计分布概率q并生成数据集根据隐私预算ε计算出映射概率矩阵然后将数据集随机化映射为在此基础上利用k-svd算法获得自适应的稀疏表示字典

本发明进一步的改进在于,步骤2-2)的具体操作为:电力公司服务器根据广播的种子生成服从对称伯努利分布的矩阵然后根据利用凸优化重构算法得到稀疏表示数据进一步计算得到最终的各用户汇聚数据集

本发明具有如下有益的技术效果:

本发明提供的智能电网中同时具有隐私保护和负载均衡的数据汇聚方法,该方法通过对每个用户产生的敏感数据利用随机化应答技术进行扰动,同时利用压缩感知技术对数据进行压缩传输,最后利用重构恢复算法进行隐私数据汇聚。相较于一般的集中式数据汇聚添加拉普拉斯噪声实现差分隐私保护的方法,该方法从用户本地端便保证了敏感数据隐私,同时解决了传统传输方式靠近中心服务器端节点传输负载过重的问题。通过理论分析和实验分析,实验结果都证实了本发明在保证用户隐私的同时保证了数据效用性。

附图说明

图1是同时具有隐私保护和负载均衡的数据汇聚过程示意图;

图2是传统的传输方式与负载均衡的传输方式对比图,其中图2(a)为传统传输方式,图2(b)为本发明传输方式;

图3是传统的传输方式与负载均衡的传输方式带来的系统整体传输负载对比图;

图4是不同隐私预算下针对二值数据类型本发明与已有的集中式添加拉普拉斯噪声机制的汇聚数据统计误差对比图;

图5是不同隐私预算下针对多值数据类型本发明与已有的集中式添加拉普拉斯噪声机制的汇聚数据统计误差对比图。

具体实施方式

下面结合附图对本发明作进一步详细描述。

参照图1,本发明提供的智能电网中同时具有隐私保护和负载均衡的数据汇聚方法,包括以下步骤:

1.用户智能电表端处理

用户的智能电表正常工作过程,包括智能电表用户用电数据测量,用电数据离散化处理,用电数据随机化扰动,加权数据生成和用电传输数据生成,具体包括以下步骤:

step1用电数据测量:根据需求测量第i个用户智能电表的真实用电数据ei,测量得到的数据并不直接传输;

step2用电数据离散化处理:参考现在的“阶梯式电价”的方式,将用户用电数据ei离散化设置为di,此时的数据也不直接传输;

step3用电数据随机化扰动:参考图1,首先根据隐私预算ε计算出随机化映射向量pi,即共k个元素,其中k表示离散数据种类数,随机化映射向量各元素表示数据映射为其他数据的概率,各元素和为1,然后用户用电数据di根据随机化映射概率随机映射得到扰动数据

step4加权数据生成:此时用户的扰动后数据为智能电表根据服务器广播的种子生成一组服从对称伯努利分布的m个随机数,并构成向量然后通过计算生成加权数据

step5用电传输数据生成:第1个用户的加权数据为x1,生成的压缩传输数据y1=x1,传输到下一用户,第i个用户的加权数据为xi,与第i-1个用户的压缩传输数据yi-1相加,生成当前的压缩传输数据yi,即yi=yi-1+xi,传输到下一用户,逐跳传输直到生成第n个用户的压缩传输数据yn,传输到电力公司服务器端,yn的表达式为

其中,n表示整体用户数,m表示压缩输出数据量,且m<<n。

2.服务器端处理

step1自适应字典训练:电力公司服务器根据历史数据得到各数据的统计分布概率q并生成数据集根据隐私预算ε计算出映射概率矩阵然后将数据集随机化映射为在此基础上利用k-svd算法获得自适应的稀疏表示字典

step2计算汇聚数据集:电力公司服务器根据广播的种子生成生成服从对称伯努利分布的矩阵然后根据利用凸优化重构算法得到稀疏表示数据进一步计算得到最终的各用户汇聚数据集

参考图2和图3,本发明在传输负载上的优越性分析如下:假设整个系统感知节点数n,汇聚节点获取到m=sn(s为采样率)个测量值,根据传统的传输方法,所有节点通过逐跳传输数据到服务器,因此整体的传输负载量为:

(1+n)*n/2≈0.5n2(2)

本发明,各感知节点端传输负载一致为m,因此整体的传输负载量为:

m*n=sn2(3)

对比表达式(2)和(3)可得,只要本发明采用的采样率低于0.5,使用本发明提出的隐私数据汇聚方法便可以降低整体的传输负载,更重要的是,传统的方法通过逐跳传输,因此越距离服务器近的节点承载的传输负载越重,开销越大;本发明提出的方法将负载分散,极大降低了主传输网络的负载量,延长了生命周期。

参考图4,针对0、1二值数据,本发明针对数据隐私性和效用性的分析如下:集中式添加laplace噪声的方法,压缩汇聚向量yn添加的噪声服从laplace分布,表示为:噪声方差值为var(elap)=2/mε2,本发明引入噪声是在本地端得到为方便对比,进一步表示压缩汇聚向量yn添加噪声其中根据随机化应答可得var(δ)=1/(1+eε),同时考虑φ服从对称伯努利分布,因此本发明的噪声方差值为比较两种方式的噪声方差值,本发明引入的噪声量较大,而小的噪声方差值意味着更好的数据效用性,因此本发明提出的方法效用性较差,但因为本发明实现数据扰动是在本地端,因此隐私保护水平要远远优于集中式添加噪声的方法;随着放宽隐私级别增加隐私预算ε,本发明和集中式添加噪声的发方法最终汇聚的重构数据的均方误差都呈现出不同程度的降低,主要是因为随着隐私预算增大,引入系统的噪声量降低,带来的扰动影响更小。

参考图5,针对不同离散种类的数据,随着隐私预算ε的增大,本发明提出的智能电网中同时具有隐私保护和负载均衡的数据汇聚方法,产生的均方误差逐渐降低,这反映了本发明同样适用于多值情况,同时也反映了差分隐私保护隐私性和效用性存在折衷的性质,即隐私预算越大,数据的隐私性降低,而数据的效用性得以提升,反之亦然。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1