一种基于并行标签传播的异构网络社区发现方法

文档序号:9866471阅读:299来源:国知局
一种基于并行标签传播的异构网络社区发现方法
【技术领域】
[0001] 本发明设及网络结构分析技术领域;特别是设及异构网络的社区发现方法。
【背景技术】
[0002] 社会交互行为的异构性是移动社交网络的显著特点之一,其表现为既存在虚拟空 间中用户之间的线上交互,又存在物理空间内用户之间的线下交互。具体而言,一方面用户 间的在线交互形成线上社交网络,另一方面用户间的线下交互形成线下社交网络。因此,如 何实现线上社会交互与线下社会交互的有效融合,W准确刻画用户间的异构交互行为,成 为异构移动社交网络社区发现方法研究所需应对的首要挑战。
[0003] 标签传播算法(Label Propagation Algorithm,LPA)是近年提出的一种快速社区 发现方法,具有线性时间复杂度。然而,基于传统LPA的社区发现方法无法发现重叠式社区 结构。COPRA对LPA进行了扩展,但依旧存在Ξ个方面的不足:其一,COPRA虽然能够发现重叠 式社区结构,但是不能用于面向异构交互网络的社区发现;其二,COPRA的迭代结束判定条 件较为苛刻,对于某些网络结构其收敛速度较慢;其S,C0PRA会导致"巨型社区"的出现,影 响所发现社区结构的整体性能。SLPA是对LPA的最新扩展,该方法虽然避免了大量"迷你社 区"的出现,但是其整体性能很大程度上取决于迭代次数与隶属度阔值,其关键性能指标 (例如模块度)随着上述参数取值的不同而显著变化,导致可用性下降。

【发明内容】

[0004] 针对W上缺陷,本发明提供一种有效实现线上社会交互与线下社会交互有效融 合,能准确刻画用户间的异构交互行为的异构网络社区发现方法。
[0005] 本发明一种基于并行标签传播的异构网络社区发现方法具体的技术方案为:
[0006] -种基于并行标签传播的异构网络社区发现方法,包括标签初始化阶段、标签循 环更新阶段和社区构造阶段;标签循环更新阶段是基于并行标签传播,允许节点标签在异 构网络的多个子网中相对独立地并行传播,通过融合多个子网的并行传播结果更新节点标 签。
[0007] 优选地,一种基于并行标签传播的异构网络社区发现方法的标签循环更新阶段包 括W下步骤:
[000引步骤一:计算节点的线上标签与线下标签;
[0009] 步骤二:融合节点的线上标签与线下标签;
[0010] 步骤Ξ:判断融合后的节点标签是否满足标签传播阶段的终止条件;若是,得到最 终标签;若否;则继续从步骤一开始整个标签更新步骤。
[0011] 优选地,一种基于并行标签传播的异构网络社区发现方法的标签传播阶段的终止 条件为:标签循环更新达到预定义的最大迭代次数,或连续的两次循环中所出现的标签集 合相同且任一标签所标识的最小节点相等。
[0012] 优选地,一种基于并行标签传播的异构网络社区发现方法的社区构造阶段依据节 点的标签二元组将其划分至重叠的社区之中。
[0013] 优选地,一种基于并行标签传播的异构网络社区发现方法还引入衰减因子约束标 签的传播,W控制巨型社区的出现。
[0014] 优选地,一种基于并行标签传播的异构网络社区发现方法用于加权异构网络时, 需根据节点之间链接的权重对标签赋值函数进行调整。
[0015] 优选地,一种基于并行标签传播的异构网络社区发现方法用于有向异构网络时, 需调整邻接矩阵赋值。
[0016] 优选地,一种基于并行标签传播的异构网络社区发现方法适用于包含Ξ个及W上 子网的异构网络融合与社区发现时,需修改标签融合子函数。
[0017] 本发明W异构网络融合为中屯、,提出一种基于并行标签传播机制的异构网络社区 发现方法化ybrid Label Propagation Algo;rithm,HLPA)。其中,并行标签传播机制的核屯、 是允许节点标签在异构网络的多个子网中相对独立地并行传播,通过融合多个子网的并行 传播结果更新节点标签。本发明能够有效实现线上社会交互与线下社会交互的有效融合, W准确刻画用户间的异构交互行为。
【附图说明】
[0018] 图-1网络社区发现方法流程示意图;
[0019] 图-2标签循环更新阶段示意图;
[0020] 图-3基于位置的社交网络示意;
[0021] 图-4异构交互网络示意;
[0022] 图-5基于并行标签传播的异构网络融合机制;
[0023] 图-6 HLPA方法运行过程示意;
[0024] 图-7异构交互网络线性融合结果示意;
[00巧]图-8 COPRA方法运行过程示意;
[0026] 图-9不同隶属度阔值下的HLPA方法性能示意;
[0027] 图-10不同标签更新机制下的HLPA方法性能示意;
[00%]图-11不同标签衰减因子条件下HLPA方法性能示意;
[0029] 图-12不同标签传播方法性能示意。
【具体实施方式】
[0030] 下面结合实施例和附图来对本发明进行详细说明。
[0031] 一方面,本发明提出并行标签传播机制,其核屯、是允许节点标签在异构网络的多 个子网中相对独立地并行传播,通过融合多个子网的并行传播结果更新节点标签。下面结 合实例对并行标签传播机制做出进一步阐述。
[0032] 该机制的具体内容如下:对于任意一个节点VI而言,假设其在时刻t的标签为Cl (t),Nfn与Nff'分别代表VI在网络A°n与中的邻接节点集合,则VI在下一时刻t+1的标签 为:
[0033]
(1)
[0034]其中fmeae为标签融合函数,C(t +巧与皆f咬+巧側分别代表时刻t+1时Vi在网络 A°n与A°ff中的标签,采用异步更新机制,形式化表示为:
[0037] 基于上述并行标签传播机制,本发明提出面向异构网络社区发现的化PA方法,将 异构网络的融合无缝嵌入至标签的传播过程,是大规模异构网络重叠式社区发现的有效方 法。具体而言,为实现重叠式社区发现,HLPA允许一个节点拥有多个标签,方法包含W下Ξ 个步骤:
[0038] 1 )标签初始化阶段,每一节点VI关联于一个二元组<Ci,bi>,其中Cl为社区标签,bi 为节点Vi对社区Ci的隶属度,初始时所有bi的取值为1;
[0039] 2)标签循环更新阶段,节点标签在线上/线下交互网络中相对独立地并行传播,即 在一次更新过程中节点VI将被同时赋予线上标签诗η与线下标签cfK.其中時η由VI的线上邻 接节点集合Nfn化据公式(2)计算,而cfff则由VI的线下邻接节点集合Ni?ff'依据公式(3)计 算;随后依据公式(1)融合线上标签详η与线下标签cfH'得到本循环中节点VI的最终标签。更 新机制如下:
[0040] 计算节点VI的线上标签与线下标签:Wcr为例,首先将其赋值为VI的所有线上邻 接节点标签的集合,并累加相同标签的隶属度;然后对标签及其隶属度归一化得到二元组 集合{《坤"(x),bΓ(xリ},使得隶属度之和为l;同时引入隶属度阔值θ = l/v,其中v为任一节 点可隶属的最大社区数,从集合{《诗"树,bfn閑巧中删除所有隶属度小于Θ的二元组;如果 bf"(x)响取值皆小于阔值Θ,则仅保留对应于最大隶属度的二元组;删除操作后,再次对 惦r(X),bfn闽)}进行归一化处理,得到线上标签cfn的最终值惦严賊,時η賴成同样地, 计算求得线下标签诗ff的最终倾辟"的,巧fi(xW。
[0041] 融合节点Vi的线上标签与线下标签:依据公式(1)搞坤"与卸ff线性叠加并归一化, 使得隶属度之和为1;删除隶属度小于阔值Θ的二元组并再次归一化,得到节点VI的最终标 签{衔树,馬賊〉}。
[0042] 标签传播阶段的终止条件为:标签循环更新达到预定义的最大迭代次数或者下述 条件被满足:连续的两次循环中,所出现的标签集合{ff-i(句]-与拉0)};相同且任一标签 与〇0所标识的最小节点数量mt-i (X)与mt (X)相等,形式化表示为:
[0047] 3)社区构造阶段,依据节点的标签二元组将其划分至重叠的社区之中。由于可能 出现完全相同的社区,需要进行社区的重复检测与删除。
[0048] 与其他标签传播方法类似,化PA方法亦会导致"巨型社区"的出现,其部分原因在 于标签在网络中不受任何限制的传播。为此,本发明引入衰减因子S(Decay Coefficient) 约束标签的传播,W控制"巨型社区"的出现,实现方法的优化。将标签衰减因子δ定义为一 个取值范围为[0,1]的实数。每一节点标签对应一个Ξ元组(c,b, inf)参数inf表示标签C的 影响力,其取值由衰减因子S与标签的传播距离共同决定。假设标签C的传播距离为d,则有 inf =(l-S)d,显然衰减因子δ可W约束标签的传播距离。衰减因子越大则传播过程中标签 影响力的下降速度越快,其有效传播距离越小,从而在一定程度上控制了 "巨型社区"的出 现。
[0049] 对于加权异构网络,只需对标签赋值函数进行如下调整:b = b^wu,其中wi康示 节点VI与Vj之间链接的权重。
[0050] 对于有向异构网络,只需调整邻接矩阵赋值,即:若存在有向边(vi,vj),贝?Μυ = 1。 显然,一般情况下矩阵A是非对称矩阵。
[0051] 对于多子网异构网络,只需修改标签融合子函数,使其适用于一个节点在多个子 网络中并行标签的融合。
[0052] 假设有如图3所示基于位置的社交网络,其蕴含的线上交互与线下交互可分别表 示为如图4所示的两个独立子网络,为方便起见,将图3中的屯个用户从左至右分别标记为 A_Gd
[0053] 首先,将异构交互网络中节点的标签初始化为a-g,如图5中第一层所示;然后,节 点标签分别在线上交互网络与线下交互网络中相对独立地并行传播(此处基于异步更新机 制完成子网内部的节点标签传播,更新顺序为A-G),一次迭代后的结果如图5中第二层中红 色/蓝色标签所示;之后,依据融合函数对不同子网络的传播结果进行融合,结果如图中第 二层中绿色标签所示。
[0054] 针对上述异构交互网络,图5描述了并行标签传播机制的一次执行过程。W节点B 为例,其线上邻接节点集合为{A,C,D},线下邻接节点集合为{A,C};对于线上交互子网,处 理节点削寸节点A的标签已经更新为b,故而从{b,c,d}^个标签中随机选取C作为B的线上标 签;类似地,对于线下交互子网,节点B的线下标签更新为b;对整个异构交互网络,依据融合 函数得到节点B的标签为C。
[0055] 由上可知:并行标签传播机制下,标签在异构网络的多个子网络中相对独立地并 行传播,节点的新标签同时取决于其线上与线下交互网络,而交互信息的融合动态发生于 社区发现的过程之中,而不是如同线性融合机制一般在社区发现过程之前一次完成。相比 其他异构网络融合机制,基于并行标签传播的融合机制既保留了不同社会交互类型所蕴含 的信息,又实现了异构交互的有效融合,同时继承了标签传播所
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1