基于分层随机图的在线社会网络差分隐私保护方法_2

文档序号:9618714阅读:来源:国知局
预测值^ ,跳转执行步骤5. 12);
[0040] 5. 7)计算当前节点Z的连接概率预测值/丨;
[0041] 5. 8)生成当前节点Z的左子树:
[0042] 5. 9)生成当前节点f的右子树鳥* ;
[0043] 5. 10)以当前节点f的左子树~作为新的当前节点,跳转执行步骤5. 3);
[0044] 5. 11)以当前节点f的右子树^作为新的当前节点,跳转执行步骤5. 3);
[0045] 5. 12)输出当前节点f的关联概率值{P J。
[0046] 优选地,所述步骤5. 1)中计算注入噪音测度值λ b的函数表达式如式(3)所示;
[0048] 式⑶中,λ b为注入噪音测度值,ε 2为预设的隐私预算,~为当前节点f的左子 树,为当前节点f的右子树。
[0049] 优选地,所述步骤5. 2)中计算连接概率测度值λ。的函数表达式如式(4)所示;
[0051] 式⑷中,λ。为连接概率测度值,ε 2为预设的隐私预算,Α为当前节点f的左 子树,I*为当前节点f的右子树。
[0052] 优选地,所述步骤5.5)中计算节点连接概率预测值;^的函数表达式如式(5)所 示;
[0054] 式(5)中,;g为节点连接概率预测值,为以当前节点f为根节点的子树中 所有节点间边的数量,ε2为预设的隐私预算,ly为当前节点f的左子树,果*为当前节点f 的右子树,Lap ()为拉普拉斯分布函数。
[0055] 优选地,所述步骤5. 7)中计算当前节点Z的节点连接概率预测值/;的函数表达 式如式(6)所示;
[0057] 式(6)中,卩..为当前节点Z的节点连接概率预测值,为以当前节点Z为根节点 的子树中所有节点间边的数量,ε2为预设的隐私预算,/v为当前节点f的左子树,为当 前节点Z的右子树,Lap ()为拉普拉斯分布函数。
[0058] 本发明基于分层随机图的在线社会网络差分隐私保护方法具有下述优点:针对应 对目前在线社会网络隐私结构数据保护的缺失,本发明立足于解决社会网络敏感结构数据 信息的隐私保护问题,利用分层随机图模型来刻画网络结构,接着通过马尔科夫蒙特卡洛 (Markov chain Monte Carlo, MCMC)米样方法来保证差分隐私数据的可用性,能够解决社 会网络敏感结构数据信息的隐私保护问题,能够满足差分隐私保护要求、同时保持良好的 数据可用性。
【附图说明】
[0059] 图1为本发明实施例方法的基本流程示意图。
[0060] 图2为本发明实施例方法中的简单无向网络图示例。
[0061]图3为本发明实施例中基于图2所示简单无向网络图生成的两个树结构。
[0062] 图4是本发明实施例方法在wiki-Vote网络下的F-measure值测度。
[0063] 图5是本发明实施例方法在ca-GrQc网络下的F-measure值测度。
【具体实施方式】
[0064] 如图1所示,本实施例基于分层随机图的在线社会网络差分隐私保护方法的步骤 包括:
[0065] 1)输入网络G ;
[0066] 2)基于分层随机图模型构建网络G的树结构T ;
[0067] 3)根据预设的隐私预算ε i,由马尔科夫蒙特卡洛方法在网络G的树结构T中进 行米样得到米样树Tsamplf;;
[0068] 4)以采样树的根节点Rroc]t作为初始的当前节点;
[0069] 5)根据预设的隐私预算ε 2,计算当前节点的关联概率值{PJ ;
[0070] 6)在网络G中找到以当前节点作为最近父节点的一组节点对,以关联概率值{PJ 在该组节点对之间设置一条边;
[0071] 7)判断采样树T_ple是否遍历完毕,如果尚未遍历完毕,则在采样树T _ple中查找 下一个节点作为当前节点,跳转执行步骤5);否则跳转执行步骤8);
[0072] 8)将所有组节点之间设置的边及其节点组成的净化网络_输出。
[0073] 本实施例中网络G表达为G = (V,E),用于代表用户或者实体间的连接网络,V代 表节点网络中节点的集合,fefzxfz代表网络G中边的集合。若两个网络G1= (VpED和 G2= (V2,E2)为邻居网络,则满足¥1= V2、且|E」+1 = |E2|。本实施例中,A代表网 络G对应的邻接矩阵,A e {〇, 1}ηΧ^示网络G中包含η个节点间是否包含一条边,A i j = 1则表示节点i与节点j之间存在一条边,反之At_j= 0。
[0074] 本实施例中,步骤2)构建网络G的树结构T为包含一个根节点、η个叶节点及n-1 个父节点的二叉树,树结构T中的η个叶节点对应网络G中的η个节点,每一个父节点r具 有属性连接概率Pp连接概率表示以父节点r为相同父节点的两个叶节点之间的连接概 率。针对网络G,则其中两个叶节点i、j的连接概率为Plj= p y这个r是叶节点i、j最近 的相同父节点,本实施例中用组合(T,{pj)来定义一个分层随机图模型HRG。如果该网络 G中一个网络社区包含3个子社区,每个子社区以相同的概率p连接,可以先将一个子社区 分离,再将另外两个子社区分离。对应这两个分割的父节点对应相同的概率值b = P,这产 生三个概率相同的树。在分层随机图模型HRG中,连接概率是不均匀的,这种概率不均匀性 有由树结构T的拓扑结构和参数{pj控制。
[0075] 以如图2所示简单无向网络图为例,该无向网络图包括a~g共7个节点、9条边, 由该无向网络图在分层随机图模型下生成分层概率二叉树如图3所示,分层随机图是一种 复杂网络模型,表现为一个二叉树,它不仅可以将复杂的在线社会网络进行层次聚类,而且 在可视化的同时提供了不同粒度的聚类信息。图3中,上下两个子图分别为两个不同概率 二叉树与输入网络的似然值不同,与网络匹配程度也不同。根据贝叶斯理论,在所有生成的 树空间中,节点连接概率最大树结构,与给定网络匹配程度越高。以图3中生成的两个二叉 树为例,上面的二叉树似然概率值计算为:
[0077] 而下图的二叉树似然概率值计算为:
[0079] 因此,图3上图中的二叉树与给定网络更为匹配。
[0080] 本实施例中,步骤3)的详细步骤包括:
[0081] 3. 1)从网络G的树结构T中选择一个随机的初始采样树T。作为初始化马尔科夫 链的条件,初始化马尔科夫链并开始沿着马尔科夫链移动;
[0082] 3. 2)当沿着马尔科夫链移动到第i步时,从初始采样树T。或者上一步得到的采样 树t i中随机选出一个分枝节点r ;
[0083] 3. 3)随机构造出分枝节点r的子树,通过分枝节点r的子树选出上一步得到的采 样树i的一个邻居树Τ' ;
[0084] 3. 4)根据预设的隐私预算ε i计算转移概率Ρ,根据转移概率Ρ在马尔科夫链中 进行条件转移,同时将邻居树Τ'赋值给本步得到的采样树T1;
[0085] 3. 5)判断马尔科夫链中是否还有剩余树,如果还有剩余树则继续沿着马尔科夫链 移动,并跳转执行步骤3. 2),否则跳转执行步骤3. 6);
[0086] 3. 6)将采样树1\作为最终得到的采样树Τ __输出。
[0087] 本实施例中,步骤3. 4)中计算转移概率Ρ的函数表达式如式(1)所示;
[0089] 式(1)中,Ρ为转移概率,ε i为预设的隐私预算,Λ u为差分隐私全局敏感度,Τ' 为本步得到的邻居树,为上一步得到的采样树,£为分层随机图的最大似然概率。隐私 预算ε i用来控制差分隐私的隐私保护水平,通常值越小,代表隐私保护水平越高,本实施 例中隐私预算h和隐私预算ε 2的预设值相同。差分隐私全局敏感度Λιι决定差分隐私中 加入噪声量的参数,加入噪声过多会影响结果的可用性,过少则无法提供足够的隐私保护。
[0090] 本实施例中,分层随机图的最大
当前第2页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1