1.本发明涉及数据保护技术领域,更确切地说,它涉及一种面向电力用户社交网络的隐私保护方法及系统。
背景技术:2.电力系统领域中,用户之间的社交网络可以用于相关机构进行分析,从而发挥其数据价值,切实解决实际问题。例如,可以通过分析电力用户之间的联系来优化电力资源配置,提高用户用电体验。但是,如果直接将一个真实的电力用户社交网络发布,往往会泄露用户的隐私信息,因此,将真实的用户社交网络扰动之后再发布,保证用户隐私安全是一个值得深入研究的问题。
3.在数据隐私领域中常用的一种经典方法是匿名化技术,该方法能够去除节点的一些识别信息。但是当攻击者有一定的背景知识或者其他辅助信息时,他们很容易就可以实现去匿名化。
4.为了克服匿名化技术的局限性,差分隐私保护技术被应用于保护社交网络。差分隐私技术的关键思想是确保一条连接边对最终结果的影响是有限的。现有的社交网络隐私保护方法要么是对整个社交网络进行噪声的扰动,要么是将社交网络进行编码,在编码过程中添加噪声。前者容易引入过量的噪声,后者则容易丢失原始社交网络的结构信息,造成过量的信息损失。
技术实现要素:5.本发明的目的是克服现有技术中的不足,提出了一种面向电力用户社交网络的隐私保护方法及系统。
6.第一方面,提供了一种面向电力用户社交网络的隐私保护方法,包括:步骤1、对电力用户的原始数据进行处理,构造电力用户的社交网络,记录用户信息和用户之间的连接信息;步骤2、通过采用结合拉普拉斯机制和指数机制的标签传播算法,对电力用户进行分组;步骤3、对分组之后的电力用户的信息进行提取,并且添加拉普拉斯噪声进行扰动,最终生成一个新的社交网络。
7.作为优选,步骤2包括:步骤2.1、根据用户之间的连接信息获取每个用户的邻居数量,并向其添加拉普拉斯噪声,此过程分配的隐私预算为,;步骤2.2、为每个用户分配一个标签,结合指数噪声机制更新用户的标签,从而得到最终的用户分组情况,此过程分配的隐私预算为,。
8.作为优选,步骤3包括:步骤3.1、获取每个用户到其所在组的邻居数量和不同组之间的连接总数,并向其
中添加拉普拉斯噪声,此过程分配的隐私预算为,;步骤3.2、对于同一个组内的用户,使用优先连接模型生成用户连接;步骤3.3、对于不同组的用户,使用简单随机图模型生成用户连接;步骤3.4、将同一个组内和不同组用户的连接信息进行整合,得到最终的用户社区网络。
9.作为优选,步骤2.1包括:步骤2.1.1、基于用户的社交网络图,获得每个用户对应的邻居数量;步骤2.1.2、对获得的邻居数量添加拉普拉斯噪声,分配的隐私预算为。
10.作为优选,步骤2.2包括:步骤2.2.1、初始化,将所有用户随机分成m组,每个用户被随机分配一个标签,其中m为用户总数的算术平方根的取整值;步骤2.2.2、对获取的扰动后的每个用户的邻居数量进行降序排列,从而确定标签传播的顺序,即邻居数量越大的用户的顺序越靠前;步骤2.2.3、根据所述标签传播的顺序对用户进行遍历,获取用户到各个组的邻居数量,即;步骤2.2.4、通过指数机制更新用户的标签,用户分到第k组的概率为:
11.其中,为每一轮遍历的隐私预算,c为遍历的总轮数,和为用户到第i、k组的邻居数量,i的取值是从整数1到整数m。
12.作为优选,步骤3.1包括:步骤3.1.1、对于同一个组内的用户,统计其在该组内的邻居数量,并使用拉普拉斯噪声对真实值进行扰动,分配的隐私预算为;步骤3.1.2、对于不同组的用户,统计组与组之间的连接总数,并使用拉普拉斯噪声进行扰动,分配的隐私预算为。
13.作为优选,步骤3.2包括:步骤3.2.1、在同一组内的用户数为时,生成个用户构成的初始小型连通图,,每个用户至少有一条连接边;步骤3.2.2、每次加入一个新的用户,它有条边与现有用户连接,,新用户与用户相连的概率取决于用户的邻居数量,计算公式如下:
14.其中,为用户j的邻居数量;步骤3.2.3、不断加入新用户并产生连边,直到总的用户数量达到。
15.作为优选,步骤3.3包括:步骤3.3.1、在两个组的用户数分别为和时,根据不同组之间的用户连接总数
,计算出不同组用户之间的连接概率为;步骤3.3.2、基于计算出的连接概率,通过生成0-1之间的随机数的方式确定用户之间是否有连边,从而生成不同组之间所有的用户连接。
16.作为优选,步骤3.4中,将所有组内的用户连接和不同组间的用户连接全部合并到同一个社区网络中。
17.第二方面,提供了面向电力用户社交网络的隐私保护系统,其特征在于,用于执行第一方面任一所述的面向电力用户社交网络的隐私保护方法,包括:数据处理模块,用于对电力用户的原始数据进行处理,构造电力用户的社交网络,记录用户信息和用户之间的连接信息;用户分组模块,用于通过采用结合拉普拉斯机制和指数机制的标签传播算法,对电力用户进行分组;网络重构模块,用于对分组之后的电力用户的信息进行提取,并且添加拉普拉斯噪声进行扰动,最终生成一个新的社交网络。
18.本发明的有益效果是:1.本发明在满足差分隐私的前提下对用户进行分组,有效降低了数据的维度。
19.2.本发明针对同一组内用户和不同组间用户的不同特征,采用不同的方法进行提取和重构社交网络,降低了噪声的扰动影响。
20.3.本发明设计了一种面向电力用户社交网络的隐私保护方法,在减小噪声干扰的同时尽可能提高了合成的社交网络的可用性。
附图说明
21.图1为一种面向电力用户社交网络的隐私保护方法的流程图;图2为一个电力用户社区网络的结构示意图;图3为一种面向电力用户社交网络的隐私保护系统结构框图。
具体实施方式
22.下面结合实施例对本发明做进一步描述。下述实施例的说明只是用于帮助理解本发明。应当指出,对于本技术领域的普通人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
23.实施例1:如图1所示,本技术提供了一种面向电力用户社交网络的隐私保护方法,包括:步骤1、对电力用户的原始数据进行处理,构造电力用户的社交网络,记录用户信息和用户之间的连接信息。
24.步骤1中,如图2所示,包含20个电动汽车的用户之间的23条连接关系,其中圆圈代表用户,圆圈之间的连线表示用户之间有连接,用户之间有连接表示他们曾在同一个地点进行电动汽车的充电操作。
25.步骤2、通过采用结合拉普拉斯机制和指数机制的标签传播算法,对电力用户进行分组。
26.步骤2包括:步骤2.1、根据用户之间的连接信息获取每个用户的邻居数量,并向其添加拉普拉斯噪声,此过程分配的隐私预算为,。
27.步骤2.1包括:步骤2.1.1、基于用户的社交网络图,获得每个用户对应的邻居数量。
28.步骤2.1.2、对获得的邻居数量添加拉普拉斯噪声,分配的隐私预算为,全局敏感度为2。
29.步骤2.2、为每个用户分配一个标签,结合指数噪声机制更新用户的标签,从而得到最终的用户分组情况,此过程分配的隐私预算为,。
30.步骤2.2包括:步骤2.2.1、初始化,将所有用户随机分成m组,每个用户被随机分配一个标签,其中m为用户总数的算术平方根的取整值。示例地,在用户数量为20时,将所有用户随机分成组。
31.步骤2.2.2、对获取的扰动后的每个用户的邻居数量进行降序排列,从而确定标签传播的顺序,即邻居数量越大的用户的顺序越靠前;步骤2.2.3、根据标签传播的顺序对用户进行遍历,获取用户到各个组的邻居数量,即;步骤2.2.4、通过指数机制更新用户的标签,用户分到第k组的概率为:
32.其中,为每一轮遍历的隐私预算,c为遍历的总轮数,例如设置;和为用户到第i、k组的邻居数量,i的取值是从整数1到整数m。
33.步骤3、对分组之后的电力用户的信息进行提取,并且添加拉普拉斯噪声进行扰动,最终生成一个新的社交网络。
34.步骤3包括:步骤3.1、获取每个用户到其所在组的邻居数量和不同组之间的连接总数,并向其中添加拉普拉斯噪声,此过程分配的隐私预算为,并且之间不存在大小关系。
35.步骤3.1包括:步骤3.1.1、对于同一个组内的用户,统计其在该组内的邻居数量,并使用拉普拉斯噪声对真实值进行扰动,分配的隐私预算为,这里对应的全局敏感度为2;步骤3.1.2、对于不同组的用户,统计组与组之间的连接总数,并使用拉普拉斯噪声进行扰动,分配的隐私预算为,这里对应的全局敏感度为1。
36.步骤3.2、对于同一个组内的用户,使用优先连接模型生成用户连接。
37.步骤3.2包括:步骤3.2.1、假设同一组内的用户数为,生成个用户构成的初始小型连通图,,每个用户至少有一条连接边;
步骤3.2.2、每次加入一个新的用户,它有条边与现有用户连接,,新用户与用户相连的概率取决于用户的邻居数量,计算公式如下:
38.其中,为用户j的邻居数量;步骤3.2.3、不断加入新用户并产生连边,直到总的用户数量达到。
39.步骤3.3、对于不同组的用户,使用简单随机图模型生成用户连接。
40.步骤3.3包括:步骤3.3.1、假设两个组的用户数分别为和,根据不同组之间的用户连接总数,计算出不同组用户之间的连接概率为;步骤3.3.2、基于计算出的连接概率,通过生成0-1之间的随机数的方式确定用户之间是否有连边,从而生成不同组之间所有的用户连接。
41.步骤3.4、将同一个组内和不同组用户的连接信息进行整合,得到最终的用户社区网络。
42.步骤3.4中,将所有组内的用户连接和不同组间的用户连接全部合并到同一个社区网络中。
43.实施例2:本发明提供了一种面向电力用户社交网络的隐私保护系统,如图3所示,该系统包括以下模块:数据处理模块,用于对电力用户的原始数据进行处理,构造电力用户的社交网络,记录用户信息和用户之间的连接信息;用户分组模块,用于通过采用结合拉普拉斯机制和指数机制的标签传播算法,对电力用户进行分组;网络重构模块,用于对分组之后的电力用户的信息进行提取,并且添加拉普拉斯噪声进行扰动,最终生成一个新的社交网络。
44.综上所述,本发明设计了一种面向电力用户社交网络的隐私保护算法,结合拉普拉斯噪声机制和指数噪声机制,在标签传播方法的基础上对电力用户进行分组,降低了数据的维度,针对同一组内和不同分组之间的不同特征,分别获取相关信息并进行扰动,避免出现严重的信息损失,在保护电力用户社区网络隐私的同时尽量保证原始社区网络的结构特征。