面向社区检测应用的社会网络数据发布隐私保护方法_2

文档序号:8543977阅读:来源:国知局
合V按度数降 序排列,得到新的节点序列。本发明所采用的社区检测方法,可W采用GN算法(Girvan和 Newman提出的社区结构检测算法)来做社区检测,或其他已知的社区检测方法。
[0035] 步骤二、K匿名形成超级节点的过程。此过程中:
[0036] 首先,选择第一个超级节点的种子节点,该里选择当前节点列表中度数最大的节 点,即排在首位的节点,此时节点集合V中除去已选中的节点。
[0037] 然后,计算该个超级节点和节点集合V中的每个节点的距离,选择最近的节点合 为超级节点。当有多个节点与当前的超级节点的距离最小且相同时,优先考虑与当前超级 节点的种子节点为同一个社区的候选节点;如果候选节点中没有与当前超级节点的种子节 点为同一个社区的节点时,优先选择单节点社区节点。此时节点集合V中除去已选中的节 点。
[003引接着,继续循环计算距离、合并节点并更新节点集合直到当前的超级节点包含的 节点个数达到隐私水平K,即>K。隐私水平K的取值范围为1 <K《n,其中n是原始网络 图中节点总个数。
[0039] 之后,选择下一个超级节点的种子节点。重复W上步骤直到剩下的节点集合V的 个数小于K,则分别计算该些节点与前面已形成的几个超级节点的距离,然后合并到距离最 小的超级节点中,当该样的超级节点有多个时,优先选择种子节点与之为同一个社区的超 级节点合并。直到节点集合为空,即所有的节点均聚类成超级节点。
[0040] 步骤=、将原始图中的边概化为带权重的超级边,其中权重即为原始图中连接两 个超级节点之间的边的数目。
[0041] 步骤四、完成聚类的工作后,是重匿名的过程,即将超级节点和超级边进行拆分。 本发明所采用的拆分方法,可W是等概率拆分方法,或其他已知的拆分方法。
[0042] 步骤五、发布匿名后的社会网络数据。
[0043] 下面针对社会网络数据发布用途中的社区检测该一应用,用具体的实例对本发明 进行进一步详细说明。
[0044] 原始图,如图2所示。
[0045] 节点的n维布尔向量;B, =(b,i,bf,...,bf)
[0046] Vi;Bi(b 01011000010 0)
[0047] ¥3:62(0blOOOlllOOOO)
[0048] ¥3:63(1IblOOOOOOOOO)
[0049] ¥4:64(0OlbOOOlOOOlO)
[0化0] VgjBsdOOOblOOOOOOO)
[0化。Ve;B6(loooibooooooo)
[0化引 V7;B7(0 lOOOObOOOOOO)
[0化引 V8;Bs(0 lOlOOObOOOOO)
[0054] ¥9:69(0lOOOOOObOOOO)
[005引 Vi0;Bi0(0OOOOOOOObOOO)
[0化6] OOOOOOOOObOO)
[0057] ¥口;6。(0 0010000000b0)
[005引 Vi3;Bi3(000000000000b)
[0059] 两节点间的距离公式:
[0060]
【主权项】
1. 面向社区检测应用的社会网络数据发布隐私保护方法,其特征是,包括如下步骤: 步骤1、先初始化数据;再对初始化后的数据进行初步的社区检测,得到匿名前的初始 的社区划分;后将数据的节点集合按度数进行排列,得到新的节点序列; 步骤2、K匿名形成超级节点;SP 步骤2.1、选择当前节点序列中度数最大的节点,作为当前超级节点的种子节点,并在 节点集合中除去已选中的节点; 步骤2. 2、计算这个超级节点和节点集合中的每个节点的距离,选择最近的节点合并为 超级节点,并在节点集合中除去已选中的节点; 步骤2. 3、继续重复上述步骤2. 2,即计算距离、合并节点和更新节点集合的过程,直到 当前超级节点包含的节点个数达到设定的隐私水平K,则开始下一个超级节点的处理; 步骤2. 4、重复上述步骤2. 1-2. 3,直到节点集合中剩下的节点个数小于设定的隐私水 平K ; 步骤2. 5,分别计算节点集合所剩下的节点和之前已形成的几个超级节点的距离,并逐 个将剩下的节点分别合并到距离最小的超级节点中,直到节点集合为空,即节点集合的所 有节点均聚类成超级节点; 步骤3、将数据的边概化为带权重的超级边,其中权重即为原始图中连接两个超级节点 之间的边的数目; 步骤4、将超级节点和超级边进行拆分; 步骤5、发布匿名后的社会网络数据。
2. 根据权利要求1所述的面向社区检测应用的社会网络数据发布隐私保护方法,其特 征是,步骤1中,初始化数据即是去掉显示的标识属性,改用重新编号的标识符表示。
3. 根据权利要求1所述的面向社区检测应用的社会网络数据发布隐私保护方法,其特 征是,步骤1中,采用GN算法来做社区检测。
4. 根据权利要求1所述的面向社区检测应用的社会网络数据发布隐私保护方法,其特 征是,步骤2. 2中,当有多个节点与当前的超级节点的距离最小且相同时,则优先选择与当 前超级节点的种子节点为同一个社区的候选节点合并为超级节点;如果候选节点中没有与 当前超级节点的种子节点为同一个社区的节点时,则优先选择单节点社区节点合并为超级 节点。
5. 根据权利要求1所述的面向社区检测应用的社会网络数据发布隐私保护方法,其特 征是,步骤2. 3和2. 4中,设定的隐私水平K的取值范围为I < K < n,其中n是原始网络图 中节点总个数。
6. 根据权利要求1所述的面向社区检测应用的社会网络数据发布隐私保护方法,其特 征是,步骤2. 5中,当前节点集合中的节点与多个超级节点的距离最小且相同时,则将当前 剩下的节点合并到种子节点与之为同一个社区的超级节点中。
7. 根据权利要求1所述的面向社区检测应用的社会网络数据发布隐私保护方法,其特 征是,步骤4中,将超级节点和超级边以等概率进行拆分。
8. 根据权利要求1所述的面向社区检测应用的社会网络数据发布隐私保护方法,其特 征是,步骤1中将数据的节点集合按度数降序排列,得到新的节点序列;此时,步骤2中选择 当前节点序列中度数最大的节点即排在首位的节点,作为当前超级节点的种子节点。
【专利摘要】本发明公开一种面向社区检测应用的社会网络数据发布隐私保护方法,对数据进行初始化数据和社区检测后,将网络图中的节点进行排列;将数据通过K匿名形成超级节点,并概化边为带权重的超级边;将超级节点和超级边进行拆分;发布匿名后的社会网络数据。本发明在发布数据时,保证匿名要求的同时,更好的保存了原始图的社区结构这一结构信息,有利于数据分析者做社区的相关分析。
【IPC分类】G06F21-62
【公开号】CN104866781
【申请号】CN201510277513
【发明人】李先贤, 王焕杰, 刘鹏, 王利娥
【申请人】广西师范大学
【公开日】2015年8月26日
【申请日】2015年5月27日
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1