一种复杂网络中节点传播能力的评估方法

文档序号:6552593阅读:1463来源:国知局
一种复杂网络中节点传播能力的评估方法
【专利摘要】本发明公开了一种复杂网络中节点传播影响力的评估方法,包括以下步骤:初始化复杂网络中每个节点为具有相等信息量的传播源;每个传播源对活跃信息按照衰减方式传播到邻接节点,将该传播源上将被衰减传递过的信息设置为非活跃信息,将该传播源上接收到的信息设置为活跃信息;具有活跃信息的节点作为新的传播源,对活跃信息继续以衰减方式进行下一轮传播,直到每个节点上活跃信息与非活跃信息的总量收敛到稳定值即达到稳定状态;统计每个节点上活跃信息与非活跃信息之和记为信息总量,信息总量越大则表明该节点的传播能力越强。本发明通过少量采样节点确定传播衰减参数,具有较高的准确性和可靠性,减少了计算复杂度。
【专利说明】一种复杂网络中节点传播能力的评估方法

【技术领域】
[0001] 本发明属于复杂网络数据挖掘技术,具体为一种复杂网络中节点传播能力的评估 方法。

【背景技术】
[0002] 现实世界的很多事物都是相互影响彼此关联的,它们通常能够以复杂网络的形式 进行表现,比如社交网络、论文合著网络及通信网路等。在这些网络上经常存在着信息(如 消息、知识及病毒等)的传播,因此为了抑制或促进传播的过程,通常需要对网络中节点的 传播能力进行分析。但由于传播原理及所处的环境不同,各种传播的方式往往呈现出多样 化的特点,难以精确的进行测量。而通过SIR等病毒传播模型(SIR模型是传染病模型中最 经典的模型,其中S表示易感者,I表示感染者,R表示移出者)对节点的传播能力进行拟合 分析,理论上具备虽具有较高的准确性,但模拟过程需要消耗大量计算资源,不利于针对大 规模数据的应用。
[0003] 过去的十几年间,出现了一些对节点传播能力进行评估的方法,比如KShell方 法、PageRank方法、各种平衡精确度和时间消耗的扩展近邻方法等。这些方法或无法自适 应真实传播过程的传播率(广义的传播率,综合考虑恢复率等因素),又或自身包含无法准 确确定的参数,使其利用存在一定限制。


【发明内容】

[0004] 为了克服现有技术的不足,本发明提出了一种通过简化的信息扩散方式对复杂网 络中的真实传播过程进行近似拟合的节点传播能力评估方法,该方法能通过对少量节点的 采样确定传播衰减参数,具有较高的准确性和可靠性,减少了计算复杂度。
[0005] -种复杂网络中节点传播影响力的评估方法,包括以下步骤:
[0006] 步骤S1 :初始化复杂网络中每个节点为具有相等信息量的传播源,此时传播源中 的信息为活跃信息;
[0007] 步骤S2 :每个传播源对活跃信息按照衰减因子α以衰减方式传播到邻接节点,在 该传播源上将被衰减传递过的信息设置为非活跃信息,以及将接收到的信息设置为活跃信 息,衰减因子α的取值范围为(〇,1);
[0008] 步骤S3 :具有活跃信息的节点作为新的传播源,对活跃信息继续按照步骤S2的传 播方式进行下一轮传播,直到每个节点上活跃信息与非活跃信息的总量收敛到稳定值即达 到稳定状态;
[0009] 步骤S4 :信息传播达到稳定状态后,统计每个节点上活跃信息与非活跃信息之和 记为信息总量,信息总量越大则表明该节点的传播能力越强;
[0010] 所述衰减因子α按照如下方式确定:
[0011] 步骤S11 :在复杂网络中进行节点随机抽样,分别对各抽样节点进行SIR感染能力 测试,并按照SIR感染能力由高到低或由低到高对各抽样节点排序;
[0012] 步骤S12 :在(0,1)区间提取多个数值作为候选衰减因子;
[0013] 步骤S13 :选取一个候选衰减因子;分别对于每一个抽样节点,初始化该抽样节点 为传播源,此时传播源中的信息为活跃信息;传播源对活跃信息按照选取的候选衰减因子 以衰减方式传播到其邻接节点,在该传播源上将被衰减传递过的信息设置为非活跃信息; 具有活跃信息的节点作为新的传播源,对活跃信息继续按照选取的候选衰减因子以衰减方 式进行下一轮传播,在该传播源上将被衰减传递过的信息设置为非活跃信息,在该传播源 上将新接收到的信息设置为活跃信息,按照如此方式传播,直到每个样本节点上活跃信息 与非活跃信息的总量收敛到稳定值即达到稳定状态;信息传播达到稳定状态后,统计每个 节点上活跃信息与非活跃信息之和记为信息总量,计算整个网络中各节点的信息总量之和 记为该抽样节点在选取的候选衰减因子下的信息扩散能力评估值;按照信息扩散能力评估 值由高到低或由低到高对各抽样节点排序,得到选取的候选衰减因子所对应的抽样节点排 序;
[0014] 步骤S14 :更换候选衰减因子,按照步骤S13的方式得到每一个候选衰减因子所对 应的抽样节点排序;
[0015] 步骤S15 :计算步骤S11得到的抽样节点排序与每一个候选衰减因子所对应的抽 样节点排序之间的排序相似度,找到使得排序相似度最大的候选衰减因子即为衰减因子 α 〇
[0016] 与现有技术相比,本发明的有益效果体现在:
[0017] 通过简化的信息扩散方式拟合网络中真实的信息传播过程,具有比SIR等模型更 高的时效性。通过对少量抽样节点采样的结果与高精度或真实网络中信息传播过程所产生 的结果进行逼近,能够找到较优的信息扩散参数,具有比其他节点传播排序方法更高的准 确性,并且排序结果可以随着网络中实际传播率进行自适应。

【专利附图】

【附图说明】
[0018] 图1为本发明方法流程图。
[0019] 图2为实例应用本发明方法的散布分析图;
[0020] 图3为实例应用KShell方法的散布分析图;
[0021] 图4为实例应用度方法的散布分析图;
[0022] 图5为实例应用扩展度方法的散布分析图;
[0023] 图6为实例分别应用本发明方法、KShell方法、度方法和扩展度方法在blog关联 数据集上的准确性趋势图。

【具体实施方式】
[0024] 为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对 本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并 不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要 彼此之间未构成冲突就可以相互组合。
[0025] 步骤S1 :初始化网络中每个节点为具有相等信息量1的传播源,此时传播源中的 信息为活跃信息。
[0026] Infactive(i) = l|i e N
[0027] 其中,N为网络中所有节点数量,Infartive⑴代表节点i上的活跃信息量。
[0028] 步骤S2 :对于每个传播源,活跃信息按照衰减因子α以衰减的方式传递到它的邻 接节点。传播源上被衰减传递过的信息被标识为非跃状态,不再参与信息的传递。传播源 上接收到的新传递来的信息标识为活跃状态。新收到的多个传播源传递来的活跃信息可进 行叠加。

【权利要求】
1. 一种复杂网络中节点传播影响力的评估方法,其特征在于,包括以下步骤: 步骤S1 :初始化复杂网络中每个节点为具有相等信息量的传播源,此时传播源中的信 息为活跃信息; 步骤S2:每个传播源对活跃信息按照衰减因子α以衰减方式传播到邻接节点,在该传 播源上将被衰减传递过的信息设置为非活跃信息,以及将接收到的信息设置为活跃信息, 衰减因子α的取值范围为(〇,1); 步骤S3 :具有活跃信息的节点作为新的传播源,对活跃信息继续按照步骤S2的传播方 式进行下一轮传播,直到每个节点上活跃信息与非活跃信息的总量收敛到稳定值即达到稳 定状态; 步骤S4 :信息传播达到稳定状态后,统计每个节点上活跃信息与非活跃信息之和记为 信息总量,信息总量越大则表明该节点的传播能力越强; 所述衰减因子α按照如下方式确定: 步骤S11 :在复杂网络中进行节点随机抽样,分别对各抽样节点进行SIR感染能力测 试,并按照SIR感染能力由高到低或由低到高对各抽样节点排序; 步骤S12 :在(0,1)区间提取多个数值作为候选衰减因子; 步骤S13 :选取一个候选衰减因子;分别对于每一个抽样节点,初始化该抽样节点为传 播源,此时传播源中的信息为活跃信息;传播源对活跃信息按照选取的候选衰减因子以衰 减方式传播到其邻接节点,在该传播源上将被衰减传递过的信息设置为非活跃信息;具有 活跃信息的节点作为新的传播源,对活跃信息继续按照选取的候选衰减因子以衰减方式进 行下一轮传播,在该传播源上将被衰减传递过的信息设置为非活跃信息,在该传播源上将 新接收到的信息设置为活跃信息,按照如此方式传播,直到每个样本节点上活跃信息与非 活跃信息的总量收敛到稳定值即达到稳定状态;信息传播达到稳定状态后,统计每个节点 上活跃信息与非活跃信息之和记为信息总量,计算整个网络中各节点的信息总量之和记为 该抽样节点在选取的候选衰减因子下的信息扩散能力评估值;按照信息扩散能力评估值由 高到低或由低到高对各抽样节点排序,得到选取的候选衰减因子所对应的抽样节点排序; 步骤S14 :更换候选衰减因子,按照步骤S13的方式得到每一个候选衰减因子所对应的 抽样节点排序; 步骤S15 :计算步骤S11得到的抽样节点排序与每一个候选衰减因子所对应的抽样节 点排序之间的排序相似度,找到使得排序相似度最大的候选衰减因子即为衰减因子α。
【文档编号】G06F17/30GK104102703SQ201410322575
【公开日】2014年10月15日 申请日期:2014年7月8日 优先权日:2014年7月8日
【发明者】杨宗凯, 刘三女牙, 陈矛, 闵磊, 唐向阳, 刘智 申请人:华中师范大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1